接受指令后輸出圖像,數秒鐘可生成一幅畫
人工智能,如何妙筆“生”畫
核心閱讀
(資料圖片)
輸入一段話,“繪”出一幅畫——人工智能的繪畫本領,吸引眾多職業畫師和零基礎用戶嘗鮮。人工智能繪畫的本質是計算,接受“語言描述”指令后根據自身的理解還原出圖像。未來,人工智能技術應用于藝術創作等領域,還要注意防范潛在風險,讓技術進步更好地造福社會。
不用畫筆、顏料,輸入一段描述性文字,計算機就能自動解析,生成相應的畫作。2022世界人工智能大會上,人工智能繪畫的展示令觀眾驚嘆。
一些過去專屬于人類創作的領域,比如繪畫、書法、寫作、作曲,如今人工智能也已開始涉足。人工智能是如何繪畫的?當前沿技術與藝術相遇,將碰撞出怎樣的火花?在內容、版權等方面又是否存在問題?
從文本到圖像,人工智能繪畫本質是計算
人工智能繪畫是一個從文本到圖像的生成過程,輸入一段話,生成一幅畫,本質是計算。簡要地說,計算機通過大量學習,能識別特定圖片元素和文本之間的關聯。同理,人工智能程序在收到“語言描述”指令后,可以根據自身的算法還原出圖像。
設定計算機程序作畫的想法由來已久。早在20世紀70年代,就有藝術家開發了操作機械臂的電腦程序,讓機械臂按照指令在畫紙上作畫。近些年,人工智能技術日新月異,科研人員嘗試設計自動作圖的計算機程序。但過去很長一段時間,人工智能“畫”出的作品普遍不夠好,往往只是一些模糊的圖像元素的組合,還稱不上是完整的畫。
今年以來,人工智能畫技迅速“進化”。談及技術突破原因,百度文心一格總架構師肖欣延認為,這是預訓練大模型的興起、大數據的訓練和擴散模型的出現3方面共同作用的結果。
具體來說,預訓練大模型增強了人工智能的通用性,成為人工智能技術及應用的新基座;大數據的訓練中,通過在眾多高性能GPU(圖形處理器)算力資源中進行并行學習,計算機能夠在短時間內完成大量的數據學習。近年來,幾乎所有人工智能的技術發展都受益于這兩方面的進展。而對人工智能繪畫來說,擴散模型的出現至關重要。
擴散模型的原理是,通過人為逐步添加噪聲,讓圖像逐漸變“模糊”,再不斷學習去噪過程,如此人工智能就能從完全是噪聲的圖片中逐漸還原出清晰的圖片,即“畫”出圖像。
“這一過程與人類學習相似。通常,人們學畫從臨摹開始,機器也是如此。它最初生成的圖像可能很模糊,但計算機會不斷修正,從而輸出越來越清楚、層次越來越豐富的圖像。”肖欣延說。
擴散模型讓人工智能繪畫技術實現跨越,不僅作畫質量快速提升,生成時間也縮短到幾秒鐘。
眾多用戶嘗鮮,大量應用加速“畫技”進化
湯林杰是某互聯網公司的運營人員。工作中,他需要借助一些圖片來豐富文案,而網絡上找到合適的配圖并不容易。今年10月,了解人工智能繪畫程序后,他嘗試自己“畫”圖。現在,人工智能繪畫工具已經是他工作的重要輔助。
隨著算法模型對公眾開放以及訓練數據成本的下降,人工智能繪畫門檻越來越低,一些簡易化操作平臺在國內外興起。如今,不僅一些職業插畫師嘗試用人工智能繪畫程序輔助作畫、激發靈感,許多沒有繪畫基礎的用戶也開始嘗鮮,并“曬”在社交平臺上。
大量需求的涌現也加速了技術的更新迭代。“用人工智能繪畫的人越多,算法就越能理解輸入的描述文本,畫作質量就越高。”肖欣延表示,當前人工智能繪畫水平與今年初相比,已經有很大進步。
不過,目前的人工智能繪畫技術并不完美。首先,可控性仍然不高,即計算機不能很好理解人類指令的含義,即便是輸入“畫兩個蘋果,左邊紅色,右邊綠色”這樣的簡單描述,生成的圖像也可能有很大偏差;其次,細節呈現能力還不夠。比如,對空間、透視和光影的刻畫就很不如意。不少人工智能渲染出的畫作,初看上去驚艷,認真觀察問題卻不少。
但肖欣延認為,人工智能繪畫在技法上的缺陷未來有望得到彌補。比如,基于跨模態大模型和強大的深度學習框架,百度開發的技術一定程度上已經緩解這些問題。此外,未來人工智能不僅能作畫,還能根據文本描述生成視頻,并直接配上解說文字,“可以把視頻生成看作是維度更高的繪畫,從技術層面看,這是可以實現的。”
防范潛在風險,守住法律和倫理底線
人工智能進入繪畫領域,計算機會取代人類畫師嗎?
在肖欣延看來,好的繪畫與構圖、設計語言、視覺情緒息息相關,即使人人都可以用人工智能技術作畫,但通常只有高水平的畫師才能制作出優秀的人工智能繪畫作品,“人工智能只是作畫的輔助工具”。此外,雖然有的人工智能繪畫語言嫻熟,也包含細膩的情感,但并不意味著機器有意識、情感,它不過是學過類似的作品,又恰好呈現出來了。“優秀的藝術作品往往是人的思想的投射,目前機器并沒有真正具備思考能力。”肖欣延說。
不少業內人士認為,不妨以開放的心態擁抱人工智能繪畫,接受新事物。可以預想,將來繪畫中一些繁瑣、重復性的工作可能由計算機完成,創作者能騰出更多時間去構思想法與創意,調整構圖、色彩、光影氛圍等。
“人工智能可能會激發繪畫創造的活力。”肖欣延表示,20世紀前后,照相技術讓傳統肖像畫失去市場,促使一些畫家向非寫實方向創新。與人工智能技術融合,或許能激發畫家創作出別開生面的作品。
不過,由于人工智能繪畫發展剛剛起步,技術發展也引發關于版權、內容把控等問題的爭議。比如,有人認為,未經授權人工智能畫作模仿原畫的內容、構圖和風格等,侵犯了原作者的版權,有違法嫌疑。也有人認為,“機器學習”過程是一種類人化的創作行為,同樣體現了創造者的思想和勞動,應當獲得版權保護。此外,還有人擔憂,人工智能繪畫技術若被濫用,可能滋生暴力等令人不適的圖像。面對新技術發展,有必要前瞻潛在的風險,只有守住法律和倫理底線,技術進步才能更好地造福社會。
不只是繪畫,寫作、作曲、生成短片,人工智能日益強大的深度學習能力,讓它與不同藝術門類發生著奇妙的碰撞。展望未來,業界專家認為,人工智能與藝術融合,一方面會降低一些藝術門類的創造門檻,讓更多人參與到當代的審美創造中來;另一方面新技術會帶來新的審美風格,人們或許能從中擴展對自身和世界的認識。(記者 喻思南)
來源:人民日報
來源:人民日報
作者:喻思南
責任編輯:馮崢
- 世界熱門:人工智能,如何妙筆“生”畫
- 環球快看:四川“大灌區”文旅發展聯盟持續擦亮品牌
- 環球視點!河北井陘:世界瀕危珍禽黑鸛飛抵越冬
- 每日觀點:法官回應庭審時說臟話:本意提醒控制語速 同事代為致歉已獲諒解
- 環球今頭條!東航、吉祥航空:國內國際航空流量逐漸“回暖”
- 每日資訊:第十九屆中國國際農產品交易會在四川成都開幕
- 天天速遞!羊因天氣寒冷被凍死牧羊犬試圖喚醒貼身取暖
- 天天精選!豬價離奇“垂直下跌”!準備好過年了?
- 環球今日訊!官方消息:北京歡樂谷12月23日起恢復開放
- 今日熱議:富貴“險”中求?理財型保險并非“萬金油”
- 全球最資訊丨元旦出游再升溫 北京至三亞機票預訂超四成
- 熱消息:貸款利率低于存款 土耳其銀行是“送錢”嗎
- 澤連斯基訪美求軍援 白宮精心謀劃秀支持
- 全球快消息!上座率已過40%,石景山路餐飲一條街逐步回暖
- 環球速訊:日客流持續回升!北京地鐵:做好運營保障,助力復工復產
- 調查|防護已做好,“七小”門店煙火氣正升騰!
- 探訪首兒所急診科,“守護,為了每一個家庭平安團圓”
- 上博拆門迎巨畫:首批英國國家美術館展品抵滬
- 【焦點熱聞】水墨二十四節氣 體驗循環往復的生命過程
- 天天動態:再這么下去,遲早得被封殺
- 每日信息:劉丹回應劉愷威戀情內幕 否認小糯米不喜歡李曉峰
- 焦點短訊!向太一天帶貨3億調侃汪小菲?蘭姐這回應絕了
- 動態:嘉陵關大戰為何唐三一直不用昊天錘?答案很簡單,有致命缺陷
- 天天資訊:2023年1月新番導視(一)
- 今日觀點!漢魏洛陽城宮城發現魏晉時期水利工程
- 河南省商丘市夏邑縣爭創“五星”支部 助力鄉村振興
- 作為制造業企業江湖里的“最高段位” 鄭州的“冠軍們”登頂 平均用了34年
- 資訊:梧州當選2024年廣西文化旅游發展大會承辦城市
- 天天信息:北京社區居民自發共享藥品、代買物資—— 匯聚愛心 傳遞溫暖
- 知名編劇倪震逝世 曾創作《大紅燈籠高高掛》




