中新網(wǎng)福建新聞正文

剽竊還是創(chuàng)作?ChatGPT背后的知識產(chǎn)權(quán)風險

  自從去年11月由OpenAI公司推出的聊天機器人ChatGPT面世以來,在人們驚嘆于其信息搜索和文本生成能力的同時,關(guān)于其背后知識產(chǎn)權(quán)的質(zhì)疑聲也隨之而來。

  國際知名語言學家喬姆斯基此前曾公開發(fā)聲表示,ChatGPT是一個高科技剽竊系統(tǒng),從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,并依照規(guī)則將數(shù)據(jù)串聯(lián)在一起,形成像人寫的文章和內(nèi)容。對于這說法,也有反對者提出,人類的學習也是從現(xiàn)有知識中進行繼承、分析然后規(guī)律化的過程,其真正威脅是讓人類不去思考。

  人工智能創(chuàng)作作品是否涉嫌剽竊?其生成內(nèi)容是否受到版權(quán)保護?是否存在法律風險?ChatGPT的火爆將這些問題推進人們的視野。

  AIGC是否存在侵權(quán)風險

  作為一個自然語言處理系統(tǒng),ChatGPT通過大量文本語料庫進行訓練,然后根據(jù)它所學到的內(nèi)容來回答問題或生成文本,其學習的能力很大程度上依賴于海量數(shù)據(jù)。

  OpenAI在2020年5月發(fā)表的名為《Language Models Are Few-Shot Learners》的論文顯示,該公司主要使用來自CommonCrawl、WebText、維基百科和書籍語料庫進行訓練。

  使用這些數(shù)據(jù)是否存在侵權(quán)風險?中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏認為,沒有約束地使用ChatGPT可能會引發(fā)知識產(chǎn)權(quán)的糾紛。“ChatGPT的開發(fā)者沒有公開生成合成的運行機制以及訓練數(shù)據(jù)的來源,在用戶引導問答的過程中,ChatGPT的回答缺失對于來源的引用,這樣有可能在用戶未注明來源對生成內(nèi)容進行使用時造成剽竊!

  北京盈科(杭州)律師事務所律師方超強則表示,AI訓練過程中不可避免地會涉及對他人享有著作權(quán)的作品進行復制使用,存在一定著作權(quán)侵權(quán)的風險。“當然這一風險也可以進行規(guī)避,例如使用不享有著作權(quán)的公開作品資源,或者經(jīng)過授權(quán)的文字作品。”

  他還指出,如果AI生產(chǎn)的文字作品與已存在的文字作品構(gòu)成實質(zhì)性相似,那么其創(chuàng)作或者后續(xù)對AI文字作品的使用,都會有侵害已存在文字作品的風險。

  公開報道顯示,目前已有國外新聞媒體指責OpenAI在不支付任何費用的情況下使用他們的文章來訓練ChatGPT。

  此前,《華爾街日報》記者Francesco Marconi在網(wǎng)上公開表示,他向ChatGPT索取了一份用來訓練它的新聞來源清單,收到的回復列出了包括路透社、《紐約時報》、《衛(wèi)報》、BBC新聞等20家媒體,但并不清楚OpenAI是否與所列出版商都達成了協(xié)議。

  全球最大的媒體集團之一新聞集團(News Corp。)旗下道瓊斯公司的法律總顧問Jason Conti日前也在提供給媒體的一份聲明中稱,任何想使用《華爾街日報》記者的作品來訓練人工智能的人,都應該從道瓊斯獲得適當?shù)氖跈?quán),但“道瓊斯沒有與OpenAI達成相關(guān)的協(xié)議”。他表示,道瓊斯公司正在對該情況進行審查,并將嚴肅對待濫用記者作品的行為。

  在北京大成律師事務所合伙人肖颯看來,這其實涉及“文本數(shù)據(jù)挖掘”是否需要相應的知識產(chǎn)權(quán)授權(quán)的問題。ChatGPT需要對語料庫中的數(shù)據(jù)進行挖掘和訓練,將語料庫中的內(nèi)容復制到自己的數(shù)據(jù)庫中,相應的行為通常在自然語言處理領(lǐng)域被稱為“文本數(shù)據(jù)挖掘”!爱斚鄳奈谋緮(shù)據(jù)可能構(gòu)成作品的前提下,文本數(shù)據(jù)挖掘行為是否侵犯‘復制權(quán)’當前仍存在爭議!毙わS說。

  她指出,在比較法領(lǐng)域,日本和歐盟在其著作權(quán)立法中均對合理使用的范圍進行了擴大,將AI中的“文本數(shù)據(jù)挖掘”增列為一項新的合理使用的情形。“目前我國著作權(quán)法依舊保持了合理使用制度的封閉式規(guī)定,僅著作權(quán)法第二十四條規(guī)定的十三種情形可以被認定為合理使用,也就是說,目前我國著作權(quán)法并未將AI中的‘文本數(shù)據(jù)挖掘’納入到合理適用的范圍內(nèi),文本數(shù)據(jù)挖掘在我國依然需要相應的知識產(chǎn)權(quán)授權(quán)!

  AIGC可以受到版權(quán)保護嗎

  公開報道顯示,ChatGPT可以編寫代碼、撰寫詩歌,甚至還能通過一定提示完成短篇小說的寫作,令人不禁提出疑問:AIGC是否屬于創(chuàng)作?人工智能能替代人類作者嗎?

  人工智能研究專家田濤源對中青報·中青網(wǎng)記者表示,目前ChatGPT本質(zhì)上還是在做詞條的排列組合,會根據(jù)人類表達的需求給出最接近人類喜好的答案!爱斔牧Χ鹊竭_‘詞’這個級別的時候會給人感覺好像是在創(chuàng)作,但實際上它無法跳出訓練文本庫的歸納范圍,即無法創(chuàng)造人類不知道的新知識!

  方超強也指出,AI創(chuàng)作在本質(zhì)上,是人類創(chuàng)作的衍生;需要明確的是,是人類設(shè)計了程序,訓練了程序,進而達到AI軟件能夠相對智能地輸出一些符合人類要求的作品。歸根結(jié)底,本質(zhì)上還是人在主導。

  事實上,當被問及“你生成的內(nèi)容是作品嗎”,ChatGPT也承認,“我可以根據(jù)輸入的提示來生成文本,但是這些生成的文本并不算是作品,因為它們并沒有蘊含創(chuàng)造性、獨創(chuàng)性、藝術(shù)性等元素,僅僅是根據(jù)預先訓練好的模型對輸入的提示進行生成而已。因此,我生成的內(nèi)容更類似于工具或輔助工具,可以幫助人們自動生成一些文本,但是它們不算是創(chuàng)意作品或原創(chuàng)作品!

  此前,已有多篇學術(shù)論文將ChatGPT列為作者。據(jù)《自然》網(wǎng)站報道,至少有4份已發(fā)表和預印本上的論文使用了ChatGPT作為論文的“合著者”。

  針對這種情況,日前已有多家學術(shù)期刊發(fā)表聲明,完全禁止或嚴格限制使用ChatGPT等人工智能機器人撰寫學術(shù)論文!犊茖W》雜志表示不接受使用ChatGPT生成的投稿論文,同時不允許ChatGPT作為論文合著者!都毎泛汀读~刀》則表示論文作者不能使用人工智能工具取代自己完成關(guān)鍵性任務,作者還必須在論文中詳細解釋他們是如何使用這些人工智能工具的。

  北京云嘉律師事務所副主任、中國政法大學知識產(chǎn)權(quán)研究中心特約研究員趙占領(lǐng)在接受中青報·中青網(wǎng)記者采訪時表示,按照目前絕大部分國家的著作權(quán)法,使用人工智能軟件產(chǎn)生的內(nèi)容不屬于法律意義上的作品,人工智能軟件本身不能視為法律意義上的作者,使用者也并非著作權(quán)人。

  “但從商業(yè)角度而言,AI智能公司花了大量金錢和技術(shù)資本打造了高度智能的AI程序,對該程序衍生的‘作品’完全不予保護,也有違公平!狈匠瑥娭赋,此前國內(nèi)司法實踐中,對于字庫軟件生成的具有獨創(chuàng)性和藝術(shù)美感的“字體”給予著作權(quán)保護,也是對AI作品進行保護的一種體現(xiàn)。他認為,如何對現(xiàn)有知識產(chǎn)權(quán)理論和法律體系進行調(diào)整,為AI文本或其他AI作品,包括AI美術(shù)作品、音樂作品等,提供合理且必要的權(quán)利保護體系,已經(jīng)是目前較為迫切的命題。

  “個人認為,對于具有獨創(chuàng)性兼具一定藝術(shù)高度的AIGC作品,應當受到知識產(chǎn)權(quán)的保護,反之則不予保護;相應的知識產(chǎn)權(quán)權(quán)屬應當歸屬于AI公司;至于這一類的AIGC作品保護、使用規(guī)則,是否需要比對人類創(chuàng)作作品進行縮減或限制,仍有待進一步的探討。”方超強還建議,“應對AIGC內(nèi)容進行有限度的保護,如果不加以限制,未來可能會出現(xiàn)AI公司手握‘創(chuàng)作霸權(quán)’的局面,影響甚至抑制人類創(chuàng)作者的創(chuàng)作熱情,長遠來說,會影響人類的知識產(chǎn)權(quán)創(chuàng)作。”

  但就目前ChatGPT的表現(xiàn)來看,它的“創(chuàng)作”所體現(xiàn)出來的觀點通常并不鮮明,更缺乏原創(chuàng)性,表達方式雖未必與其他人作品構(gòu)成實質(zhì)相似,但也經(jīng)常借鑒一個或多個主體的表達方式。目前也只能在部分領(lǐng)域、部分方面替代人類的工作。但也帶來一定的弊端,容易給某些群體帶來思維惰性,在一定程度上可能反而抑制了創(chuàng)新。

  (應受訪者要求,田濤源為化名)

  中青報·中青網(wǎng)見習記者 李若一 記者 王林 見習記者 賈驥業(yè) 來源:中國青年報