赤子網——中國人物新聞網站|新聞熱線:010-85891267
當前位置:首頁 > 獨家報道 > 8元買3萬張人臉照片 誰在搜集、買賣你的“臉”?

8元買3萬張人臉照片 誰在搜集、買賣你的“臉”?

2019-11-19 10:09 來 源:新京報 瀏覽 字體:

11月初,國內“人臉識別第一案”引發了輿論關于人臉識別技術與安全的討論。而不久前,“ZAO”APP的興起也讓AI換臉走入了普通民眾的視野,值得注意的是,AI換臉技術目前已被應用于影視、娛樂等各方面,甚至是淫穢視頻。這引發了社會對人臉數據是否可能被濫用的爭議。

誰在搜集你的臉?誰在買賣你的臉?

新京報記者近日調查發現,網上有一些私下售賣人臉數據的賣家,有發帖者稱8元可買3萬張人臉照片。有賣家表示可以提供“更多渠道”的人臉圖片,按照3000元可買24000套人臉照片來計算,相當于一套只要一毛多。還有賣家表示,其出售的照片大部分來自朋友圈,且沒有取得對方同意。

北京大學法學院教授薛軍告訴新京報記者,有必要對人臉識別設置門檻,“人臉信息伴隨著人的終身,一旦發生泄露風險就特別大,所以要進行最嚴格的保護,首先必須得到用戶明示同意才能收集,我個人認為有時得到個人同意也不行,需要國家授權才能收集敏感的生物識別信息?!?/p>

人臉照片在網上可公開下載

部分來自于網站爬取

人臉照片正在被作為商品售賣。

新京報記者在IT社區、網絡商城等多個平臺搜索發現,有不少人臉照片可供免費下載或付費購買。付費金額由帖子發布者自定,多在10元到20元左右,如有發帖者表示可以“8元購買60名志愿者的每人500張照片,共計3萬張照片”。

記者瀏覽多個人臉下載帖發現,人臉圖片的上傳者一般會對圖片中涉及的人臉屬性進行標明,如“小孩”、“明星”、“網紅”等。照片場景則多種多樣,有個人自拍,也有與朋友的合影,而被截取下來的只有人臉部分的圖片。

據了解,在IT社區中可公開下載的照片標記為外國研究機構提供的國外志愿者照片,如有帖子表示“耶魯大學AR人臉數據庫、卡耐基梅隆大學PIE數據庫等打包賣15元”,這些圖片是為了訓練人臉識別專門搭建的數據集,圖片質量較好。

不過,也有部分照片來源于網站爬取。記者下載了13萬張標記為“網紅”的人臉圖片后,隨機選取五張照片在百度識圖搜索后發現,其中一張照片為一名香港藝人。而記者搜索與該藝人名字相關的圖片后發現,所下載的人臉圖片的來源五花八門,有的截取自娛樂新聞網站的新聞圖片,也有博客發布的博文配圖。值得注意的是,有的圖片來自于已刪除的博客,但記者仍然可以在搜索引擎搜索到相關圖片,只不過源網頁顯示“內容已刪除”。

對于可直接下載的圖片,有發布者表示,其提供的數據集可以任意拿來下載研究,“只要別用在商業和不正當用途就可以了”。

對此,北京市中聞律師事務所合伙人趙虎表示,這或存侵犯肖像權與著作權的問題?!八斯_上傳到貼吧或者微博的他人的圖像,只是這些肖像權人在行使自己的肖像權,如果沒有明確授權他人使用的,任何人出于商業目的而進行使用,肯定是會侵犯他人肖像權的。除了上傳肖像,還有可能上傳一些自己拍攝的其他圖片。若未經著作權人明確授權可以使用這些圖片外,還會涉嫌侵犯他人的著作權?!?/p>

中國人民大學法學院副教授丁曉東對此的看法則較為寬松,“我認為爬取公開的圖片本身沒有問題,比如明星的圖片,但這一行為也需要根據圖片的來源和圖片的場景來認定,如果對微博和好友相冊等半公開圖片進行爬取,由于存在生物識別信息,存在一定風險,爬取就需要有一定的限制?!?/p>

有賣家稱人臉圖片“可定制”

3000元可購買24000套

新京報記者發現,由于國外進行人臉識別項目時間較早,目前公開提供的人臉數據庫的圖片多來自國外,照片也以外國人為主,但對于國內的人臉識別研究項目,為讓模型識別更為精準,最好使用中國或亞洲面孔的圖片,此時外國數據庫的圖片往往無法滿足需求。

對此,也有網購平臺上的賣家提供照片“定制”。新京報記者在淘寶搜索人臉數據集后注意到,某店鋪提供“同人N張人臉數據集,超10萬人不同角度、不同場景、不同身份、無遮擋、非名人非網絡圖庫”的人臉數據庫,還支持“一站式”的數據定制服務。商品詳情介紹顯示,數據獲取含有人工數據采集、自動化數據采集、調研問卷收集三個途徑。

新京報記者查閱店鋪信息發現,購買人臉數據的定價為十元,但具體購買多少需要再與店家進行溝通。記者根據店鋪公開顯示的手機號與賣家取得了聯系?!坝行┤艘粌扇f個,有些要十萬個。一般都是要一萬個人以上,每個人五張?!痹撡u家表示,“(照片)都是自己采集的?!?/p>

該名店家強調,“所有的照片都是近期的?!敝劣趫D片來源,對方表示“大部分來自于朋友圈,有的是朋友圈一傳十十傳百收集來的,有的則是直接購買的,收集起來十分費勁?!?/p>

隨后,該店家發送給新京報記者一組儲存有人臉照片文件夾的截圖,截圖共包含有18張照片,每個照片均被以數字編號命名?!耙粋€人一元,五張照片,在轉賬之前,可以利用遠程操作來觀看這些照片?!?/p>

值得注意的是,該店家承認,“這個(使用照片)肯定沒有取得人家的同意?!辈贿^,在她看來,這些照片被拿來做研究并無不妥?!安皇枪嫉缴缃黄脚_或公開網站,肯定是沒問題的?!?/p>

關于定制服務,該店客服向記者發送了“定制”所需維度,包括男女比例、年齡層次比例、國籍等?!坝衅渌笠部梢哉f?!睌祿膬r格與以上因素相關。

據其介紹,最近詢問此款商品的人并不在少數,至于標價十元只是一個基數,交易的話還需要簽訂合同,通過對公賬戶轉款?!白吖~及簽訂合同是雙方的一個保障?!?/p>

此外,新京報記者在瀏覽國外網站時發現,有不少軟件公司公開出售其儲備的人臉數據庫,如一家網站儲存有75萬張人臉圖片,數據共305GB。此類包含動輒數萬人臉照片的數據庫在網絡空間并不難查找,且有的數據庫并未對其圖片來源是否合法做出明確標識。

新京報記者通過在IT社區人臉數據資源帖評論區加微信的方式聯系到一名自稱擁有人臉數據庫的賣家,對方表示如果支付3000元,可以提供24000套人臉圖像,渠道“多種多樣”。對于具體的人臉圖像來源,對方僅表示是“中國的”,但沒有透露更多。

趙虎告訴新京報記者,非法買賣人臉圖像等數據可能違反《民法總則》《侵權責任法》中對于他人隱私權、肖像權的保護。而國家機關或者金融、電信、交通、教育、醫療等單位的工作人員利用其掌握的公民人臉數據,然后進行倒賣的,可能會構成《刑法》規定的出售、非法提供公民個人信息罪?!叭绻鞘謾CAPP等非法搜集用戶相關信息,則還會違反《移動互聯網應用程序信息服務管理規定》的相關規定?!?/p>

人臉數據的信息泄露風險

專家:從制度上約束,防止信息泄露

在安恒信息安全研究院院長吳卓群看來,人臉數據存在唯一性,如果廠商將人臉數據收集以后沒有規范化應用,一旦泄露可能導致嚴重的后果。

“人臉識別本身是方便我們生活的,可以免去我們輸密碼的麻煩,但它最大的風險在于信息泄露,因為包括人臉在內的生物識別具有唯一性,這些唯一性的人臉信息一旦被采集上去,如果沒有妥善處理,可能會被濫用?!眳亲咳焊嬖V新京報記者。

10月28日,由于反對采用人臉識別的方式進入動物園,浙江理工大學特聘副教授郭兵作為消費者將杭州野生動物世界告上了法庭,該案也成為國內消費者起訴商家的“人臉識別第一案”。2019年11月1日,杭州市富陽區人民法院正式受理此案。

郭兵認為,園區進行人臉識別將收集他的面部特征等個人生物識別信息,該類信息屬于個人敏感信息,一旦泄露、非法提供或者濫用,將極易危害包括原告在內的消費者人身和財產安全?!案鶕断M者權益保護法》第29條之規定,園區收集、使用原告個人信息,應當遵循合法、正當、必要的原則,明示收集、使用信息的目的、方式和范圍,并經原告同意;而且,被告收集、使用原告個人信息,應當公開其收集、使用規則,不得違反法律、法規的規定和雙方的約定收集、使用信息。被告在未經原告同意的情況下,通過升級年卡系統強制收集原告個人生物識別信息,嚴重違反了相關規定,損害了原告的合法權益?!?/p>

新京報就此事致電杭州野生動物世界,一名工作人員證實,目前指紋識別已取消,入園者只能到年卡中心錄入人臉信息,通過人臉識別入園。該工作人員介紹,人臉識別更方便、快捷,“指紋有時候有點破皮、按(識別)不出來的?!睂τ谕饨鐚€人隱私的擔憂,該工作人員說,“就你入園掃一下(臉)?!彼a充,“指紋也是你的信息,你辦年卡的時候,身份證也留了,電話也留了,這些也是你的信息呀?!?/p>

吳卓群表示,人臉識別技術在技術上已經日趨成熟,在許多圖片識別上,AI的準確率甚至可以高過人工識別,總的來說,技術是為了方便大家,方便社會,這個技術發展本身還是比較好的,但為了防止泄露的風險,有必要從制度層面來保證人臉數據信息的流轉,或者設置一個標準來規定我們采集后什么能存,什么不能存,從制度和法律上來約束,以防止采集后出現信息泄露的問題。

北京大學法學院教授薛軍告訴新京報記者,有必要對人臉識別設置門檻,“人臉信息伴隨著人的終身,一旦發生泄露風險就特別大,所以要進行最嚴格的保護,首先必須得到用戶明示同意才能收集,我個人認為有時得到個人同意也不行,需要國家授權才能收集敏感的生物識別信息?!?/p>

人臉數據可用來做什么?

多用于研究,大量照片用于AI學習

事實上,早在人臉識別技術剛剛興起時,收集大量人臉照片用于機器AI學習就成為了人臉識別項目研究的“剛需”。

新京報記者采訪多位從業者發現,購買人臉照片的大多是從事人臉識別相關研究項目的工作人員,人臉數據被他們用于訓練機器AI的識別精確度。

AI人臉識別研究人員劉澤康向新京報記者介紹,對于AI人臉識別從業者來說,擁有幾萬張人臉照片并不罕見,他每天都需要將陌生人的人臉照片導入到模型之中,對模型進行優化。

“火爆異常的AI換臉背后的工作流程并不難理解,用戶將照片導入后,計算機會通過網絡模型對照片的像素點進行調整,從而生成與影視劇中人物表情及所處環境、光線等相匹配的人臉,實現AI換臉?!眲煽蹈嬖V新京報記者,“為達到換臉的目的,計算機需要對人臉圖像進行大量的數學運算,如果圖片數量過少,模型不夠優化,識別不夠精準,計算機便很難較好地實現識別功能?!?/p>

新京報記者發現,劉澤康的電腦中,存放著幾萬張的人臉照片。這些圖片被按照相機種類分別儲存在文件夾中。記者隨意點開劉澤康電腦中的一個文件夾,顯示共包含有2855照片。每個照片的名稱分別為其數字編號,采集場景及人物表情不盡相同,但均為正常拍攝。

據劉澤康介紹,這些照片大部分是從網絡公開的數據庫中下載的,也有數量相當可觀的一部分系志愿者提供?!罢掌话驹刚呱矸菪畔?,故不涉及侵犯公民隱私或者肖像權的問題?!?/p>

百度一名從事AI學習的技術人員對新京報記者表示,從業者收集大量人臉圖片的目的就是為了機器學習?!斑@本身是一個很枯燥的過程,比如拿到一張男性微笑的圖片,你就人工標注‘微笑’然后給機器AI識別,人工標注的多了,AI自然就更加精準了,目前這些技術實際上早已落地,例如火車站人臉識別身份證圖片”。

不過,也有從事隱私檢測的程序員對記者表示,在擁有人臉識別功能后,有些機構反而可以更多地截取人臉圖片?!坝脩粼谶M行人臉識別時,機構在技術上是可以截存用戶圖片,從而形成自己獨家數據庫的,而這些截存下來的圖片有可能他們自己用于訓練AI模型,但也不排除用來買賣”。

該名程序員表示,原先有許多人臉識別相關的AI程序是開源的,“很多人甚至連人臉數據庫都不用,可以直接下載已經訓練好的模型,但自從ZAO引發爭議后,一些模型和代碼就不再公開了,這樣導致了另一個后果,大家還得自己再找圖片進行AI訓練?!?/p>

而在劉澤康看來,技術本身并無原罪?!皼]有最精準的人臉識別,只有更精準的人臉識別。以酒店住宿為例,很多人都有過識別慢、難識別、識別條件苛刻等問題。如在目前一些酒店的人臉識別系統中,對于佩戴眼鏡等飾品或強光照等條件下,識別不夠精準,需要一再重復識別,研究的意義就在于可以擁有更快更精準的人臉識別系統?!?/p>

“AI換臉作為一種新型的技術,各方面配套還有待完善,需要社會各方向積極方面去引導,不能因噎廢食?!眲煽嫡J為。

“目前,人臉識別技術已經被廣泛運用于智能門鎖、移動支付、手機解鎖等,減少竊密、造假、冒用、頂替等可能,提升安全系數;在公司、商場、機場、學校等場景下,人臉識別技術可以提升管理效率,提升交互體驗;在刑偵及公共領域,人臉識別技術可以協助抓獲潛逃多年的犯罪嫌疑人,可以幫助失散多年的家庭團圓,執法效率和社會公共安全得以大幅提高?!卑俣劝踩偨浝眈R杰對新京報記者表示。

新京報記者 羅亦丹 李大偉

[責編:cz3326]

收藏此頁 復制網址 我要打印 網頁挑錯
免責聲明: 本網轉載稿件均不代表赤子網(www.488460.live)的觀點,不保證內容的準確性、可靠性或完整性。如涉及版權、稿酬等問題,請速來電或來函聯系。
合作伙伴

赤子網系中國社會經濟文化交流協會主管、赤子雜志社主辦的中央級網絡新聞媒體,是《赤子》雜志官方網站。

  • 新聞熱線:010-85891267
  • 傳真:010-85891267
  • 投稿郵箱:[email protected]
  • 關注微博:

掃描二維碼可關注微信公眾平臺

掃描二維碼手機瀏覽赤子網

備案號:京ICP備16019497號-1

監督電話:010-85896757 服務郵箱:[email protected]

赤子雜志社主辦 版權所有:赤子雜志社 Copyright?chizichina.com All Rights Reserved

饥荒哈姆雷特赚钱防卫