麻豆国内精品欧美在线-麻豆国内精品久久久久久-麻豆国产在线观看一区二区-麻豆国产在线观看免费-麻豆国产原创-麻豆国产一区二区在线观看

人類的最后陣地!AI看不懂漫畫造就漫畫家鐵飯碗通信

鈦媒體 2017-11-23 10:04
分享到:
導(dǎo)讀

AI工程師的很大一部分工作就是替AI“帶路”,然后告訴人類,你們的這項(xiàng)和那項(xiàng)工作都要被AI替代了。

AI工程師的很大一部分工作就是替AI“帶路”,然后告訴人類,你們的這項(xiàng)和那項(xiàng)工作都要被AI替代了。

一直以來,人類似乎都站在一個(gè)毫無還手之力的弱勢地位,或許未來真的像一些悲觀者想象中那樣,我們有AI司機(jī)、AI售貨員、AI詩人,但人類自己卻成了可憐的乞討者。

直到今天,他們第一次發(fā)現(xiàn)有一項(xiàng)工作AI在一段時(shí)間以內(nèi)都無法超越人類,而這次勝利屬于二次元――不會(huì)被AI代替的工作,是漫畫家。

連漫畫都看不懂,談什么毀滅世界?

漫畫家不會(huì)AI代替的原因很簡單,因?yàn)轳R里蘭大學(xué)的一位教授進(jìn)行了一項(xiàng)研究,最終發(fā)現(xiàn)AI根本看不懂漫畫。

4.png

以上是一則非常簡單的四格漫畫,對于人類來說理解起來非常容易:小貓?jiān)谒伎紕?chuàng)作素材,然后發(fā)現(xiàn)了小狗,要求小狗講個(gè)笑話,小狗說“你很漂亮”導(dǎo)致小貓非常憤怒。

實(shí)際上,在最后一個(gè)畫面中,小狗沒有入鏡,而“你很漂亮”本來是表揚(yáng),要和上一個(gè)畫面中的“笑話”連接起來,才能解釋出小貓的情緒。

對于AI來說,理解這些呈現(xiàn)在畫面之外的信息,簡直太困難了。

在馬里蘭大學(xué)的實(shí)驗(yàn)中,研究者搭建了一個(gè)由120萬張漫畫畫格組成的數(shù)據(jù)集,并提取出了每個(gè)畫格中的文本,利用LSTM模型,希望AI能對漫畫進(jìn)行一個(gè)連貫的了解。

關(guān)于LSTM(長短期記憶網(wǎng)絡(luò))此前已經(jīng)介紹過很多,這一模型的特點(diǎn)就是加入了記憶的概念,可以處理和預(yù)測時(shí)間序列較長元素。雖然在長文本、機(jī)器翻譯等等方面表現(xiàn)的都不錯(cuò),但在看漫畫這件事上,LSTM徹底挫敗了。

3.png

在經(jīng)過大量訓(xùn)練后,研究人員給了AI一組以前沒見過的漫畫,要求AI理解并預(yù)測下一個(gè)畫面中的文字信息或畫面內(nèi)容,結(jié)果AI的成績一塌糊涂。而人類的預(yù)測正確程度,通常能達(dá)到80%的正確率。

視覺敘事?何必強(qiáng)人工智能所難

嚴(yán)格來說,漫畫這種東西屬于“視覺敘事”――把信息隱藏于圖像之中。同樣是視覺敘事,AI理解電影就比理解漫畫容易的多,電影的主角是人,而人臉長的都是一個(gè)樣子,想要訓(xùn)練AI讀出人臉表情、識別情緒是件很簡單的事,更何況電影還會(huì)有詳細(xì)的劇本。

但漫畫最大的特點(diǎn),就是視覺上不具有連貫性。就像上文的四格漫畫一樣,第三張圖小狗還在畫面中,第四張圖就不在了。人類可以很快的理解到,名為淡定狗的小狗扔下一句話就淡定的離開。可對于AI來說,讀出這種在畫面和文字之外的信息實(shí)在是強(qiáng)人工智能所難。

2.png

其次,不同漫畫的繪畫、敘事風(fēng)格迥異,對于AI的訓(xùn)練來說也是個(gè)難點(diǎn)。簡單的四格漫畫中,每一格的場景都是相同的,可在其他漫畫中,可能這一格是打斗的場景,下一格就是一張憤怒的人臉。能看懂四格漫畫AI,再去看那種有鏡頭切換感的漫畫,也是一頭霧水。至于畫風(fēng)方面,不同漫畫家對于人臉描繪方式都有很大差異,換成AI來理解,難度又會(huì)加大了。

還有一點(diǎn),視覺敘事這件事是建立在“邏輯”和“常識”兩個(gè)概念基礎(chǔ)之上的。比如小貓說講個(gè)笑話,小狗說“你好漂亮”,理解這個(gè)情節(jié)就需要“你說我漂亮是笑話=你說我丑”這一基礎(chǔ)的邏輯。又比如哆啦A夢中常見的老鼠梗也需要“貓通常不怕老鼠”這一基礎(chǔ)常識。這些東西對于人類來說都很簡單,可是AI是不具備這些常識和邏輯概念的,我們也不能像編百科全書那樣,把這些概念灌輸?shù)紸I的大腦之中。

圍棋界的大手,到了甄?執(zhí)?里也是一集死

其實(shí)結(jié)合AI在圍棋領(lǐng)域的勝利和在漫畫上的失敗,我們可以看出,AI在完全信息信息領(lǐng)域中的表現(xiàn)和不完全信息領(lǐng)域中的表現(xiàn)完全不同。

完全信息本來是經(jīng)濟(jì)學(xué)中的一個(gè)屬于,意思是參與者可以理解整個(gè)市場的所有信息。在這里,我們可以看做一項(xiàng)工作的數(shù)據(jù)集。在圍棋這項(xiàng)工作中,所有的信息都可以歸納為數(shù)據(jù)集:游戲的規(guī)則、每一步的打法。可在漫畫中,我們最多能把畫面中做上詳細(xì)的標(biāo)注,把文本信息都提取出來。可隱藏在圖片文字之外的邏輯關(guān)系、常識等等只可意會(huì)不可言傳的東西,是無法向AI提供的。

而AI做的最差的,就是readbetweenthelines。

以此類推,AI在戲劇、歇后語、四國軍棋的暗棋(一種包含了欺騙的軍旗玩法)包括談戀愛等等一切充滿了不完全信息、欺騙與反欺騙、解讀意象、常識和邏輯的游戲中表現(xiàn)都不會(huì)太好。

這么看來,AI有點(diǎn)像《三體》里初期的智子,不會(huì)隱藏自己的想法,也不能明白隱瞞、欺騙這種概念。所以,我們真的不必對AI的勝利感到恐懼,它會(huì)是辦公室里人緣最差的那位同事和后宮里一集死的路人,某一項(xiàng)能力的突出并不能彌補(bǔ)它在不完全信息方面的短板。更何況意象、類比、反諷、隱喻這種東西,是人類最擅長的手段。

我相信,未來世界最好的樣子一定是人類和AI各司其職,做各自最擅長的事情。在視覺敘事這類AI特別不擅長的事情上,它們依然能給人類提供很多幫助。

比如用生成對抗神經(jīng)網(wǎng)絡(luò)創(chuàng)造人物形象、用監(jiān)督學(xué)習(xí)+卷積網(wǎng)絡(luò)來為線稿上色、甚至開發(fā)一款會(huì)自動(dòng)放大文字的漫畫閱讀App。這些并不是幻想,而是正在發(fā)生的現(xiàn)實(shí)。當(dāng)這些繁復(fù)的機(jī)械勞動(dòng)被AI代勞后,我們也就能更多的投入到自己擅長的事情中來:利用不完全信息環(huán)境講好更多故事,讓這個(gè)世界保持應(yīng)有的趣味。

AI 漫畫 人類 信息 理解
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。


觀點(diǎn)約架

主站蜘蛛池模板: 欧美日韩在线观看一区二区 | 国产性视频 | 亚洲精品国精品久久99热 | 亚洲精品卡一卡2卡3卡4卡 | 人与善交大片免费看 | 国产草逼视频 | 大胸美女被c | 香蕉久久一区二区不卡无毒影院 | 亚洲国产欧美另类va在线观看 | lubuntu网页版在线 | 免费超级乱淫视频播放性 | 思久久 | 国产在线综合网 | 天海翼最新作品 | 欧美一级特黄特色大片免费 | 免费成年视频 | 精品无码国产AV一区二区三区 | 亚洲人成网站在线观看青青 | 精品在线播放视频 | 91色porny| 日本精品中文字幕在线播放 | 99精品免费视频 | 日本精品人妖shemale人妖 | 亚洲琪琪 | 精品国产mmd在线观看 | 国产视频在线一区 | 午夜精品久久久 | 午夜精品久久久久久久2023 | 精品久久久久免费极品大片 | 日韩欧美精品 | 大象传媒1234区 | 精品国产一区二区三区国产馆 | 四虎在线观看 | 香蕉精品高清在线观看视频 | 欧美人在线一区二区三区 | 国产成人亚洲精品乱码在线观看 | 草草线在成年免费视频网站 | 91桃色网站| 王晶经典三级 | 99re7在线精品免费视频 | 国产福利专区精品视频 |