Skip to content

主流的性癖才是ai繪畫的第一生產力

Blake是最早試圖通過訓練,讓AI學會畫人類雙手的人。

早在去年十一月,他就興奮地在社區上分享自己如何通過訓練讓Stable Diffusion
2.0畫出自然完整的人類雙手,他還分享了自己所使用的提示詞prompt和訓練的過程。

“ai不會畫手“至今都被當做很多人類畫師最後的壁壘,假如多幾個AI繪畫愛好者好好學習,這個難關可能四個月前就被攻克了。”

當時社區裏點讚數最高的回複是這樣的:

“Stable Diffusion 2.0可以畫手。

但是Stable Diffusion 2.0不會拍片。

誰會需要一部由手出演的毛片呢?”

據統計,在90年代采樣普及的時候,百分之九十的先鋒音樂第一次拿到它都是先錄一句“Fxxk”試試音,可能科技進步的內在已經變得越來越荒誕。

各種各樣AI平台的開發商會告訴你限製AI技術發展的三大瓶頸是算力、算法和學習材料,但是在社區老哥眼裏,技術宅的性癖才是未來決定了AI技術天花板的東西。

如果非要理性地討論,我知道類似“手是人類身體結構最複雜的器官之一”、“ai無法通過二維的圖片判斷人體的骨骼結構”、“相比於它的複雜程度,手喂的太少了”這些都是有價值的結論。

為了搞明白這個問題,我也看了幾篇天書一樣的論文,直到我看到了這句話:

後來我想了想,可能手跟xx最大的共同特點是:對於技術宅來說,同屬冷門性癖。

來自ai繪圖論壇的meme

也許有成千上萬個prompt(訓練AI時所需要的提示詞)去形容發色、服裝、身材甚至更露骨的特點。但是真輪到冷門性癖的時候,嚐試用ai去挑戰科技極限的人們,那一瞬間的詞窮,不禁讓人想到那句哲學名言:“我語言的邊界,就是我思想的邊界。”

如果事情就這麽野蠻生長下去,誰會關心手好不好看呢?大多數人玩這個都是為了取悅自己,手不好看就出一張沒有手的圖好了。

就像前幾個月,我在推特看到一個騙子,他的頭像和自拍全是用AI生成的。在他推文底下有這樣一條評論“看這圖是不是ai,你就看他圖片裏有沒有手就好了。”

對於人類畫師來說,“手”幾乎成了約翰·康納。

於是,當冷門性癖變成某種meme的時候,事情就發生了改變。

3月16日Midjouney發布了自己的V5版本,原本最大的亮點是它的渲染效果,幾乎和照片一模一樣。但是在媒體的添油加醋之中,全世界隻記住了一個東西,“這次Ai學會畫手了。”

不過據公路商店了解到的事實,這次在手的問題上,並沒有質的飛躍,與其說是解決了畫手的問題,更準確的說法是出現手的圖片成圖率更高了。“一共做了四張圖片,還是有兩張圖片是不正常的,不過總比以前四張全不行要強”

其他的MidjourneyV5的渲染效果圖

Ai攻克畫手難題這個故事被講述出來的時候,屬於商業的部分總是會本能地放大;但是在另一方麵,“社區的努力”在這種對比之中卻被縮小了。沒有人願意去踩一捧一,隻是我們在這裏想要聊的是——那些來自於社區的努力幾乎不會被人注意。

至少第一次,愛好者們看到畫手難題的解決思路來自於社區。早在Midjouney5.0發布之前,越來越多的人已經把自己的注意力放在“手”上。

愛好者在社區分享的自己訓練手部繪圖能力時建立模型的過程,大多數人對這種思路表示認同“可能是建立手部模型時最好的解決方案”

開頭Blake通過prompt訓練的方式像是帶著一個嬰兒搖骰子,每一次結果都是隨機的。現在社區裏的努力,是要讓它先熟悉一類手的動作。人們試圖製作出善於描繪“手”形態的模型,但這是個漫長的過程。在機器徹底掌握方法論之前,人們隻能一個動作一個動作地教給它。唯一不同的是,因為這些動作都來自於圖片的原因,這樣的訓練對AI來說並沒有挑戰,它也不需要從最簡單的開始學習,這些技術宅的品味反倒是成為學習順序和方法科學與否的唯一標準。

猜猜它最先學會的是哪個手勢?

一定有人猜了中指食指微微彎曲的那個手勢,圖不方便放上來,不過那個確實是第二個學會的

再到一個月前,骨骼插件“ControlNet”發布,他支持通過框架去畫主體的動作。這幾乎是劃時代的技術,很快有人通過這個插件製作了手部的骨骼模型。

我不會像那些人一樣直接寫上“手部難關已被攻克”再加上幾個毫無意義的感歎號,但至少在這之後,怎麽讓“Ai畫手”這個事,人們終於看到了一條清晰明確的解決思路,剩下的都隻是訓練量的問題。

類似的故事比比皆是。

去年12月來自畫師@花椰菜的透明人體 因為ai難以模仿短暫地引起過討論。有專業的畫師說這是因為這種風格“透視很見功夫”。

但一個多月後,Ai就學會了。

對於AI來說,難的不是透視而是性癖。隻是透明人也好,手也好,他們最終通過一個叫做“好勝心”的東西變得不那麽冷門了。

不過讓這種冷門的愛好變得不再冷門的過程有另一種形式的意義。

簡單地說,當它們冷門並且小眾的時候,“喂的不夠”是限製它們產能發展的原因。這也許就是AI技術和曆史上大部分技術革命不同的地方。哪怕你隻是把它當作一個玩具,這個行為本身也可以產生屬於它自己生產力的價值。

就好比“Ai畫手”的故事裏,這個課題最終從一個小眾的性癖變成了一種大眾的念頭,在這個過程中,互聯網社區裏每個個體瑣碎的欲望、念頭、審美最終會被匯聚成一起,變成了一個可以產生力量的聲音。