從品牌網(wǎng)站建設(shè)到網(wǎng)絡(luò)營(yíng)銷策劃,從策略到執(zhí)行的一站式服務(wù)
來(lái)源:公司資訊 | 2021.12.17
好久沒(méi)出趣味 AI 的教程了,今天安排一期。
只需要一張圖片或者視頻,就可以生成相應(yīng)的二次元“老婆”。
感受一下:
放個(gè)視頻,感受更強(qiáng)烈:
GANsNRoses展示
二次元“老婆”,是跟隨視頻的動(dòng)作,而改變的。
之前我寫過(guò)一階運(yùn)動(dòng)模型的算法教程:
讓圖片動(dòng)起來(lái),特朗普和蒙娜麗莎深情合唱
功能看起來(lái)類似,但是算法實(shí)現(xiàn)是不同的。
真人驅(qū)動(dòng)動(dòng)漫圖片的算法,這種效果比較好:
二次元的正確打開方式
這個(gè)動(dòng)畫臉控制變換算法,采用的是 GAN,只需要一個(gè)輸入即可,生成+控制,用這一個(gè)算法即可。
GANsNRoses
這個(gè)算法的名字叫 GANsNRoses,一種風(fēng)格遷移算法。
簡(jiǎn)單來(lái)講,就是一種以人臉圖像的內(nèi)容代碼為輸入并輸出具有多種隨機(jī)選擇風(fēng)格代碼的動(dòng)漫形象。
算法實(shí)現(xiàn)也并不復(fù)雜:
生成器負(fù)責(zé)生成動(dòng)畫臉,辨別器負(fù)責(zé)辨別是否為動(dòng)畫臉。
生成器分為內(nèi)容編碼器c和樣式編碼器s。
樣式編碼器s,負(fù)責(zé)整體的風(fēng)格,比如頭發(fā)樣式,臉的位置,發(fā)色等。
內(nèi)容編碼器c,負(fù)責(zé)細(xì)節(jié)的把控,比如頭部?jī)A斜角度等。
想了解更詳細(xì),可以直接看論文:
https://arxiv.org/pdf/2106.06561.pdf
測(cè)試
目前有三種方式:
網(wǎng)頁(yè) Demo
Colab
本地搭建
網(wǎng)頁(yè) Demo
網(wǎng)頁(yè) Demo,用起來(lái)最簡(jiǎn)單,上傳圖片就行。
https://gradio.app/g/AK391/GANsNRoses
不過(guò)貌似只支持圖片的制作。
測(cè)試了龍母的效果,她看了估計(jì)會(huì)哭暈在廁所。
Colab
Colab 運(yùn)行也很簡(jiǎn)單,有個(gè)梯子就行。
https://colab.research.google.com/github/mchong6/GANsNRoses/blob/main/inference_colab.ipynb
省去了部署環(huán)境的煩惱,傻瓜式運(yùn)行即可,圖片和視頻,都可以測(cè)試。
本地搭建
主要是搭建環(huán)境,這個(gè)直接用 Conda 創(chuàng)建虛擬環(huán)境,然后安裝各種第三方庫(kù)即可:
conda install --yes -c pytorch pytorch=1.7.1 torchvision cudatoolkit=<CUDA_VERSION>
pip install tqdm gdown kornia scipy opencv-python dlib moviepy lpips aubio ninja
Conda 使用可以參考這一篇:
別再折騰開發(fā)環(huán)境了,一勞永逸的搭建方法
然后下載模型權(quán)重文件,就可以,模型權(quán)重文件還是蠻大的,1.6G,從 Google Drive 下載比較慢,建議直接用 Colab 測(cè)試。
總結(jié)
這種算法,其實(shí)蠻多的,單從效果來(lái)講,還有很大提升空間的。
最后,我看B站有個(gè)up主,籽岷自己做了鬼畜,新寶島版:
GANsNRoses展示2
目前,這類算法,做個(gè)鬼畜其實(shí)還行。
最后再送大家一本,幫助我拿到 BAT 等一線大廠 offer 的數(shù)據(jù)結(jié)構(gòu)刷題筆記,是一位 Google 大神寫的,對(duì)于算法薄弱或者需要提高的同學(xué)都十分受用:
谷歌和阿里大佬的Leetcode刷題筆記
以及我整理的 BAT 算法工程師學(xué)習(xí)路線,書籍+視頻,完整的學(xué)習(xí)路線和說(shuō)明,對(duì)于想成為算法工程師的,絕對(duì)能有所幫助:
我是如何成為算法工程師的,超詳細(xì)的學(xué)習(xí)路。