解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

雷鋒網 AI 科技評論按:能夠迭代進化、模仿指定數據特征的GAN(生成式對抗性網絡)已經是公認的處理圖像生成問題的好方法,自從提出以來相關的研究成果不少,在圖像增強、超分辨率、風格轉換任務中的效果可謂是驚人的。 (具體可以參見?Valse 2017 | 生成對抗網絡(GAN)研究年度進展評述 - 雷鋒網(公眾號:雷鋒網)

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

利用GAN達到圖像超分辨率和風格轉換示例

今年也有利用GAN做的簡筆畫到圖像轉換模型pix2pix(代碼地址?https://github.com/phillipi/pix2pix? ,demo地址?https://affinelayer.com/pixsrv/??)。除了下圖轉換貓的,還有建筑物的、鞋子的、包包的,模型非常有想象力,隨便畫也沒關系,感興趣的讀者可以自己到demo地址里畫畫看。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

?demo中用把線條轉換成貓的示例

GAN能生成藝術作品嗎?

GAN既然已經有如此的圖像生成能力了,我們能不能用GAN生成藝術作品呢,畢竟許多現代藝術作品看照片好像也并不怎么復雜,比如下面這幅;超寫實主義的就更不用說了。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

蒙德里安《紅黃藍的構成》

然而,要創造出一副人類覺得有藝術價值的作品并沒有那么簡單。人類喜歡創新性的作品,人類不喜歡完全模仿的作品;《蒙娜麗莎》和《蘭亭集序》只有原作者的原版才被認可是世界藝術瑰寶,后世的人就算基于它們創作,也要有自己的創新,才能帶來新的藝術價值,才能被觀賞者認可。

根據GAN的基本結構,鑒別器D要判斷生成器G生成的圖像是否和其它已經提供給鑒別器D的圖像是同一個類別(特征相符),這就決定了最好的情況下輸出的圖像也只能是對現有作品的模仿,如果有創新,就會被鑒別器D識別出來,就達不成目標了。上面幾個GAN的例子就能體現出鑒別器D帶來的這個特點,用GAN生成的藝術作品也就注定缺乏實質性的創新,藝術價值有限。

那么,能不能讓GAN具有一些創新的能力,讓這些創新有藝術價值、帶有這些創新的作品還能夠被人類認可呢?羅格斯大學藝術與人工智能實驗室、Facebook人工智能研究院(FAIR)、查爾斯頓學院藝術史系三方合作的這篇論文就通過CAN(Creative Adversarial Network,創造性對抗網絡)給出了一種答案。神經網絡庫Keras的作者Fran?ois Chollet也在Twitter上推薦了這篇文章。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

先看看作品如何

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

CAN模型生成的一些藝術作品

可以看到,生成的藝術作品風格非常多樣,從簡單的抽象畫到復雜的線條組合都有,內容層次也有區分。論文中也有對比測試結果,CAN生成的作品不僅比GAN生成的更討人喜歡,甚至來自巴塞爾藝術展的人類藝術作品都比不上CAN。(具體數據看后文)

如何認識藝術創新

剛才說到,藝術作品需要有創新性,CAN中的C就是Creative,創新性的意思。那么創新性要如何衡量呢、如何達到呢?

以往基于GAN的圖像生成方法研究中,人類可以把訓練好的網絡生成的圖像和客觀事實相對比(超分辨率、圖像補全問題中)或者根據經驗判斷(風格轉換問題中),用來衡量網絡的效果;也有過一些更早期的算法,讓人類作為訓練反饋的一環,引導網絡的訓練過程。但是對于這次的課題需要設計一個能自動訓練和生成、還要衡量作品的創新性的系統而言,以往的方法就起不到什么幫助。

同時,在作者們看來,為了能模仿人類藝術創作的過程,算法中很重要的一部分就是要把算法的創意過程和人類藝術家以往的藝術作品聯系起來,像人類一樣把對以往藝術的理解和創造新藝術形態的能力整合在一起。 為了能夠想辦法找到一個能夠衡量創新性、參與迭代訓練的創新性指標,作者們找來了一組藝術理論。

  • D.E.Berlyne認為,從生理心理學的角度講,人類的狀態中有一種叫做“喚醒水平”的指標,它可以衡量一個人有多警醒、多興奮;喚醒水平可以從最低的睡覺、休息,一直到暴怒、激動。而一副作品具有“喚醒潛力”的總體特質,它可以提升或者降低觀者的喚醒水平;它是作品新穎性、意外性、復雜性、多義性和疑惑性高低的綜合體現,這幾個屬性越高,作品的喚醒潛力就越高。

  • Colin Martindale(1943-2008)提出過一個假說,他認為在任一時刻,創意藝術家們都會嘗試增加他們作品的“喚醒潛力”,這就是一種拓寬創作習慣邊界的方法。但是,這種增加動作必須使得觀察者的負面反應盡可能小(盡量使觀察者不付出額外的努力),否則過于激進的產品就會受到負面的評價。

  • Colin Martindale還提出過一個假說,他認為當藝術家探索藝術風格的更多作用的時候,轉換藝術風格就會有提高“喚醒潛力”的作用。

這組理論只是解釋藝術創新的理論中的寥寥幾個,但是它們綜合起來給出了兩個具有計算性的、可以用于迭代訓練的指標:

  1. 創新作品的創新程度不能過高,觀者不認為作品是藝術作品的可能性應當盡可能小;

  2. 新的藝術風格就是創新的體現。

CAN網絡的構建

根據提煉出的這兩個指標,論文中基于GAN的原型構建了這樣一種新型的對抗性網絡CAN。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

CAN模型的系統框圖

首先,對于“指標1:創新作品的創新程度不能過高,觀者不認為作品是藝術作品的可能性應當盡可能小”,就可以轉換為經典的對抗性網絡,G生成圖像,經過藝術作品訓練過的D判斷G生成圖像的是不是藝術作品。這樣的對抗性網絡生成的圖像就已經可以被人類看作是藝術作品。

然后,論文中的模型還根據“指標2:新的藝術風格就是創新的體現”增加了一部分新結構用來處理藝術風格。

論文中使用了25類不同的帶標簽藝術作品用于D的訓練,包含了抽象印象派、立體派、現代派、巴洛克、文藝復興早期等等風格的共7萬5千多幅。然后經過訓練的D除了要反饋一幅圖像“是否是藝術作品”外,還要反饋“能否分辨圖像是哪種藝術風格”。G然后就會利用D的反饋生成盡量難以分辨藝術風格的圖像——難以歸類到現有分類中的,就是創新了。

“是否是藝術作品”、“是否難以分辨藝術風格”是兩種對立的信號,前一種信號會迫使生成器G生成能夠被看作的藝術的圖像,但是假如它在現有的藝術風格范疇中就達到了這個目標,鑒別器D就能夠分辨出圖像的藝術風格了,然后生成器就會受到懲罰。這樣后一種信號就會讓生成器生成難以分辨風格的作品。所以兩種信號就可以共同作用,讓生成器能夠盡可能探索整個創意空間中藝術作品的范圍邊界,同時最大化生成的作品盡可能游離于現有的標準藝術風格之外。

這也就是論文標題「CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms」的含義,創造性對抗網絡可以學習藝術風格,然后背離這些現有的風格進行藝術創作。

還說藝術風格,現在是“不好分辨”,“好分辨”不行嗎?

相比GAN,CAN增加的反饋是“是否難以分辨藝術風格”,追求的是生成的圖像藝術風格難以分辨。雖然根據藝術理論的推導,新的藝術風格是一種創新,但既然是多加了一個反饋,追求“生成的圖像藝術風格容易分辨”可以嗎?會不會也能生成不錯的作品呢?

從另一個角度看,假如追求“難以分辨”的CAN確實比追求“容易分辨”的CAN生成的圖像更好,那這就是模型選取了合理的反饋的最佳體現。

說做就做。除了CAN之外,論文中還建立了三種模型用來對比。

  • DCGAN ?64x64:經過藝術作品訓練的DCGAN(深度卷積生成式對抗網絡),輸出分辨率為64x64

  • DCGAN 256x256:相比DCGAN ?64x64,生成器多加了兩層網絡,輸出分辨率為256x256

  • scCAN:style-classification-CAN,追求“生成的圖像藝術風格容易分辨”的CAN

這三種模型生成的畫面像下面這樣

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

兩種DCGAN和scCAN生成的畫面

scCAN生成的畫面中確實有了可辨認的風格,比如人物特寫、風景或者群像。但是直觀看上去并不怎么討人喜歡。

讓我們再來看一組CAN生成的圖像,上方是人類評價最高的、下方是人類評價最低的。應該說都比scCAN生成的圖像精彩得多。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

人類評價最高和最低的CAN生成的圖像

人類能給CAN的圖像打幾分?

根據剛才的圖像可以看到,CAN的效果當然不錯,DCGAN 256x256的圖像其實也挺好。那么CAN的圖像對觀畫的人來說是不是真的已經難以分辨創作者了呢?跟真的藝術家創作的作品相比高下又如何呢?

為了具體比較,論文中做了幾個實驗,讓人類給不同組的作品打分。

實驗1、2: 來自抽象印象派藝術家的作品、選自巴塞爾藝術展的作品、CAN生成的圖像、DCGAN生成的圖像,一共4組作品,由普通人判斷這些作品來自人還是電腦,并給作品打分。

結果:實驗1里有53%的人認為CAN的圖像是來自人類的,認為DCGAN 64x64的圖像來自人的有35%; 實驗2里認為CAN的圖像來自人類的比例是75%,DCGAN 256x256則是65%。來自抽象印象派藝術家的作品無疑是比例最高的,但有意思的是,兩個實驗里認為巴塞爾藝術展的作品來自人的比例都還不如CAN高(實驗1中41%,實驗2中48%)。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

實驗2的結果數據,先讓人類評價者從幾個角度評價作品,再判斷是否是人類創作的。認為圖像是人類創作的評價者比例為Q6

實驗3:讓人類評價者從用心程度、視覺結構、互動性、啟發性幾個角度給作品評分,結果CAN全部得分最高。這個結果可謂出人意料。

解讀Facebook CAN:如何給人工智能賦予藝術創作的力量

實驗3結果數據

實驗4:為了確認CAN和scCAN之間新穎性和美學表現的高低,請了一群藝術史學生對隨機選出的CAN和scCAN圖像進行評價。認為CAN的圖像更新穎的比例為59.47%,認為CAN的圖像更加有美學吸引力的比例為60%,確實有顯著區別。

結論

論文中表示,雖然這樣的模型還是不能對藝術風格概念有任何語義方面的理解,不過它確實展現出了從以往的藝術作品中學習的能力。至于為什么人類會在多個方面給CAN打出高分,作者們也希望和大家進行開放性的探討。

論文原文地址:?https://arxiv.org/abs/1706.07068?,雷鋒網 AI 科技評論編譯

本文作者:楊曉凡

本文轉自雷鋒網禁止二次轉載,原文鏈接

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/280989.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/280989.shtml
英文地址,請注明出處:http://en.pswp.cn/news/280989.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

全向輪底盤磁導軌尋跡

全向輪底盤上安裝兩條磁傳感器帶用于磁導軌尋跡 如簡圖所示,兩條與Y直線相交的黑色線條我們認為是兩條磁檢測傳感器帶 矢量方法修正車體位置 定義軌道左為負向,軌道右為正向。傳感器左檢測為負,右檢測為正; 定義底盤坐標系為αβ&…

02-1.CSS邊框,邊界,布局相關筆記

目錄 CSS盒子模型 padding內填充 邊框 邊框屬性 border-radius margin外邊距 CSS盒子模型 Content(內容): 盒子的內容,顯示文本和圖像 >>>>類似word 文字A,改變字體與大小padding: 用于控制內容與邊框之間的距離 …

圖表庫

在2018年最后一天開源了自己的基于svg圖表庫mcharts 后面要大量時間去維護 mcharts 希望多提Issues 具體用法可以看文檔 可以一塊探討下技術問題 2019年新的開始新的起點 加油

android仿ios彈框_在“提示”框中:iOS外觀(在Android上運行),Google Maps作為Time Machine,下載Wii游戲保存...

android仿ios彈框Once a week we round up some great reader tips and share them with everyone. Read on to see how to make your Android phone look like iOS, use a Google Maps mashup like a time machine, and download Wii game saves. 每周一次,我們收集…

使用 C# 開發的摸魚背單詞軟件 ToastFish

你好,這里是 Dotnet 工具箱,定期分享 Dotnet 有趣,實用的工具和組件,希望對您有用!摸魚神器ToastFish 是一個使用 C# 開發的桌面軟件,由 Uahh 開發, 這是一個利用Windows通知欄背單詞的軟件&…

使用log4Net 輸出日志到mongodb

將日志輸入到nosql 數據庫可以保證日志輸出速度和統一管理日志,log4mongo-net 項目http://log4mongo.org/display/PUB/Log4mongofor.NET使用log4net把日志保存到Mongodb。通常可用于代替log4netMS SSQL logging ,和SQL Server相比可以節省40%的存儲空間&…

03.JavaScript對DOM操作

JavaScript引入方式 外部引入 在head或者body中&#xff0c;添加以下代碼 <script type"text/javascript" src"js/demo.js"></script> 內部引入 在head或body中&#xff0c;定義script標簽&#xff0c;然后在script標簽里面寫js代碼 <…

kotlin的suspend對比csharp的asyncawait

協程的出現大大降低了異步編程的復雜度&#xff0c;可以讓我們像寫同步代碼一樣去寫異步代碼&#xff0c;如果沒有它&#xff0c;那么很多異步的代碼都是需要靠回調函數來一層層嵌套&#xff0c;這個在我之前的一篇有介紹 rxjava回調地獄-kotlin協程來幫忙本篇文章主要介紹kotl…

file協議 控制面板_如何在Windows File Explorer導航窗格中顯示控制面板和回收站

file協議 控制面板By default, the Windows File Explorer’s sidebar is divided into big categories like Quick Access, This PC, Network, and so on. But a quick setting change can make your navigation pane look a bit more like the traditional tree you’d see i…

hdu-2612-Find a way(廣搜,bfs)

Pass a year learning in Hangzhou, yifenfei arrival hometown Ningbo at finally. Leave Ningbo one year, yifenfei have many people to meet. Especially a good friend Merceki. Yifenfei’s home is at the countryside, but Merceki’s home is in the center of city.…

過濾器(Filter)

1 什么是過濾器 過濾器JavaWeb三大組件之一&#xff0c;它與Servlet很相似&#xff01;不它過濾器是用來攔截請求的&#xff0c;而不是處理請求的。 當用戶請求某個Servlet時&#xff0c;會先執行部署在這個請求上的Filter&#xff0c;如果Filter“放行”&#xff0c;那么會繼…

03-1.JavaScript基礎語法略寫/模版字符串

基礎語法 參考前端基礎之JavaScript - Q1mi - 博客園 略寫原因 由于后續主要用jQuery編寫&#xff0c;jQuery簡化編程。大概了解JavaScript語法即可。 jQuery是一個輕量級的、兼容多瀏覽器的JavaScript庫。jQuery使用戶能夠更方便地處理HTML Document、Events、實現動畫效果…

發布適用于 .NET 7 的 .NET MAUI

點擊上方藍字關注我們&#xff08;本文閱讀時間&#xff1a;6分鐘)我們在六個月前向您介紹了 .NET 多平臺應用程序 UI (MAUI)&#xff0c;現在我們很高興地宣布 .NET MAUI 在我們的下一個主要版本 .NET 7 中普遍可用。在此短的時間范圍內&#xff0c;我們在 .NET MAUI 中的主要…

bzoj3160(FFT+回文自動機)

題目描述 https://www.lydsy.com/JudgeOnline/problem.php?id3160 題解 先把問題轉化一下&#xff0c;我們要求的是非連續對稱回文子序列。 ans回文子序列數-回文子串數。 回文子串數可以用PAM或manachar求出來。 復習了一下PAM&#xff0c;用它求回文子串數和SAM一樣&#xf…

03:數據結構 棧、隊列、鏈表與數組

算法其他篇 目錄&#xff1a; 1.1 數據結構中的一些概念1.2 棧&#xff08;stack&#xff09;1.3 隊列1.4 鏈表1.5 python中字典對象實現原理1.6 數組1.1 數據結構中的一些概念 返回頂部 1、數據結構是什么 1、簡單來說&#xff0c;數據結果就是設計數據以何種方式存儲在計…

力登:以智能化管理提升數據中心服務能力成熟度

2017年2月28日&#xff0c;由全國信息技術標準化技術委員會信息技術服務分技術委員會指導的《信息技術服務數據中心服務能力成熟度模型》發布&#xff0c;在業界首次提出“數據中心服務能力成熟度”概念&#xff0c;使得數據中心的管理真正實現了數字化和持續優化&#xff0c;是…

基于.NET 7 的 WebTransport 實現雙向通信

Web Transport 簡介WebTransport 是一個新的 Web API&#xff0c;使用 HTTP/3 協議來支持雙向傳輸。它用于 Web 客戶端和 HTTP/3 服務器之間的雙向通信。它支持通過 不可靠的 Datagrams API 發送數據&#xff0c;也支持可靠的 Stream API 發送數據。因為 HTTP/3 使用了基于 UDP…

Django01: 安裝/基礎命令/設置筆記

安裝 按官網版本支持&#xff0c;現在比較適合使用1.11版本。 下載安裝命令 pip3 install django1.11.9 新建項目 django-admin startproject mysite 運行項目 python manage.py runserver 127.0.0.1:8000 運行相關 目錄介紹 mysite/ ├── manage.py # 管理文件 └…

JavaScript校驗網址

gistfile1.txt var linkUrl https://www.baidu.com if( typeof (linkUrl) ! undefined &amp;&amp; linkUrl ! ){var strRegex ^((https|http|ftp|rtsp|mms)?://) ?(([0-9a-z_!~*\().&amp;$%-]: )?[0-9a-z_!~*\().&amp;$%-])? //ftp的user (([0-9]{1,3}.)…

線上問題隨筆記錄數據庫連接池問題

修改方法 轉載于:https://www.cnblogs.com/lvgg/p/8581506.html