百度「作弊」事件發酵:吳恩達介入調查,不容忽視的三個疑點-虎嗅網

2020-11-28 虎嗅APP

虎嗅註:


關於「百度作弊」一事,各方評論眾說紛紜,虎嗅發現,綜合各方觀點來看,這其中至少有三個疑點:


先來看看吳韌同學是怎麼加入百度的:吳韌曾是AMD異構系統首席軟體架構師,更早時期曾擔任美國惠普實驗室資深科學家及CUDA研究中心首席研究員。他是最早利用GPU進行海量解析的專家之一。2013年9月下旬,吳韌博士正式加盟百度深度學習研究院(Institute of Deep Learning,IDL),出任「傑出科學家」。


疑點一:五人參賽團隊,「作弊」不設防火牆?


此次參加ILSVRC挑戰賽的百度異構計算團隊只有五人,從5月17日ImageNet公開信發布後,百度方面第一時間出面回應的情況來看,吳韌應該是該項目團隊的負責人。百度最近宣布的調查結果也證實了這一點。


吳韌被解職的消息發布後,有聲音指出「吳韌同志的三點錯誤:一、直接帶一線團隊,不給自己設防火牆,出了事頂包的都沒有,自己做了人家的防火牆。二、出了這種事應該立即辭職,保全名聲,結果很大不同。三、錯投百度,四萬人單位,值得去嘛?」對吳韌的一系列反應表示提出質疑:


一個不了解機器學習圈子的隊伍參加機器學習的比賽,這個決策是誰做出的;如果沒有作弊,拿了第一,出去吹牛逼的人是誰?出了紕漏,背黑鍋的會是誰?也許吳同學眼裡只有勝敗,在勝敗面前迷失了,當出現了這種重大情況後,也許迅速離職的話,就不會像現在這樣被動,面子和裡子之間,一定會選擇讓裡子髒,而不會讓面子髒的,百度的技術聲譽是大局,犧牲的一定是個體。


曾經有一個大佬空降到一個公司,然後抓我去做個中層,語重心長的對我說,我需要一個防火牆,隔離帶,你幫我頂,你下一線指揮作戰,做出成績我不會虧待你,萬一出問題,你頂包走人,我也不會虧待你,說得很直白。那是我第一次知道,原來還有這麼個角色定義,吳同學太實在了,親力親為,直接指揮一線作戰,在一個創業公司這很好,在內部鬥爭激烈的大公司,這樣做風險是很大的。


吳韌的做法,是否有欠缺之處,各方觀點不一。但是不設「防火牆」,的確奇怪。


疑點二:吳恩達5月17日啟動調查,餘凱6月5日辭職,時間點過於巧合?


從吳恩達所發出的內部公開信(見文末)來看,5月17日在ImageNet發布公開信之後,百度立刻開始展開了內部調查。6月11日,百度宣布吳韌離職。但是就在這段時間裡,也就是6月2日,百度深度學習研究院副院長餘凱離職,工作事務交由吳恩達代理。雖然有媒體猜測餘凱是離職創業,而餘凱的確也在辭職信中表示要「開始創建一家機器人技術公司」,但是從時間上來看,的確過於巧合。


疑點三:「刷分」手段並不高明,百度自取其辱?


百度此次參加ILSVRC,被主辦方質疑使用多個帳號在測試集上密集提交結果,有媒體用「拿小號刷數據」來形容百度的作弊手法。作為機器視覺領域一次全球頂級的挑戰賽,百度的這種「作弊」手法是否有些太小兒科了?「使用多個帳號在測試集上密集提交結果」的多個帳號,是否容易獲得?


如果不是的話,這些帳號百度是怎樣得到的?如果是的話,百度的諸位學術大牛們,如此密集的提交結果,太過明顯,是否低估了主辦方的技術水平?


如下為吳恩達發給百度內部的郵件:


Dear fellow Baiduers,


On May 17, 2015, the organizers of the ImageNet Large Scale Visual Recognition Challenge (ILSVRC) contacted Baidu’s Heterogenous Computing team, a five-member computer systems engineering group, to inform them that they had exceeded the allowable weekly number of submissions to the ImageNet server.


Immediately, we launched our own inquiry to understand what had happened. While the inquiry was underway, we specifically refrained from making public comments to the press and on social media, out of fairness to both the Baidu employees and the ImageNet organizers. This week, we concluded the inquiry.


We found that the team's leader, Wu Ren, had directed junior engineers to submit more than two submissions per week, a breach of the current ImageNet rules.


Any action that runs counter to the highest standards of academic integrity and scientific integrity, no matter how large or small, is completely unacceptable and does not reflect the culture of our company. We have zero tolerance for such behavior. We have therefore terminated Wu Ren’s employment with the company, which has taken effect immediately.


During the inquiry, we verified that the Heterogenous Computing team's work was not connected in any way to any image recognition research by other teams at Baidu. We are also reorganizing the Heterogenous Computing team, and placing the remaining four junior engineers under the leadership of Xu Wei, under whom we expect to receive better guidance.


It is impossible to over-emphasize the importance of integrity. On matters of integrity, there is no compromise, and there is no 「gray zone.」 We must learn from this experience, and never allow any individual or any team to make any similar transgression.


There were several specific points of failure relating to this incident which I』d like to mention, because they are instructive for us going forward.


First, in the early days, some of the junior engineers had heard rumors of other organizations having multiple ImageNet accounts, and thus felt it was okay to have multiple accounts. However, others』 transgressions do not mean we can do the same.


Second, because the team was a computer systems rather a computer vision team, they didn’t understand the importance of avoiding overfitting, and there was also some ambiguity about the application of the ImageNet rules. If we don’t understand a rule, we can seek clarifications, but one must nonetheless be careful not to commit a transgression of it.


Finally, Wu Ren had supervised a team of junior engineers, who unfortunately did not receive early critical feedback from other leaders or from more knowledgeable computer vision researchers that their behavior was unacceptable. In order to give junior engineers an outlet and safe place to discuss any concerns, we are forming a Scientific Advisory panel that engineers with questions can confidentially and safely approach for advice.


The Scientific Advisory panel will initially comprise senior scientists Zhang Tong, Xu Wei, Huang Chang, and me. Any engineer who is concerned about the scientific integrity of any action of any team or individual is required to approach a member of this panel to ask their advice. If an engineer fails to approach the Scientific Advisory panel in a timely manner with their concerns and is subsequently involved in an act that breaches scientific or academic integrity, then even if these actions were carried out with the knowledge or direction of their supervisor, the engineer may be dismissed.


As our technology advances and as we become more prominent globally, we will naturally experience greater levels of global scrutiny. In today’s environment, it is also possible for the malfeasance of 2-3 engineers to tarnish the work and reputation of 47,000 others.


However, the reason for behaving with integrity is not that we are worried about external scrutiny. We will behave with integrity because it is who we are, and because this is how we want to build our company. Any other behavior is unacceptable and will not be tolerated.


Andrew Ng

相關焦點

  • 吳恩達悄然發布 AI 維基,另外他的技術崗已經招滿了-虎嗅網
    虎嗅註:似乎從百度離職之後,吳恩達回歸教育事業老本行,施展更加自如了。本文轉載自量子位,作者問耕。吳恩達又有新動作。wiki首先來說第一個。這個長假期間,吳恩達團隊在deeplearning.ai上悄然發布了一個新項目:AI維基百科。這個維基百科還向學習者們發出號召:一起來貢獻內容。目前這個維基有12個頁面,分別對應:歡迎、概述(神經網絡)、數學(導數、向量)、平臺和工具(Python、深度學習框架)、分類器、激活函數、超參數調整、代價函數等。
  • 美國植物人昏迷十年後懷孕生子,警方介入調查
    該報導介紹說,這名女子10年前因一場溺水事件進入植物人狀態,目前在莊園醫療中心(Hacienda Healthcare)接受24小時護理。2018年12月29日,她依靠護士的幫助生下一名健康的男嬰。但她的身份並未得到公布,也沒有家人公開表態。目前當地警方已介入調查,該州州長辦公室稱這種情況「令人深感不安」。
  • 「疫苗事件」再發酵 或衝擊股市 疑有基金公司踩雷
    上周,長生生物連收5個一字板跌停,最新收盤價14.5元,已跌到部分基金公司所下調其估值的14.5元。市場人士表示,本周末,疫苗事體繼續發酵,長生生物大概率將繼續跌停,基金公司估計要再下調其估值了。此外,交易人士認為,經過一個周末的發酵,「疫苗事件」或影響投資者的情緒,對股市產生一定的影響。羅生門?
  • 吳恩達旗下公司發布AI社交距離監控工具
    近日,吳恩達創立的AI公司Landing AI發布了一款社交距離檢測工具,幫助疫情期間不得不工作的人,確保他們在工作場所的社交距離,該工具可以通過分析攝像頭拍攝的實時視頻流來檢測人們是否保持安全距離。
  • 吳恩達創業關你什麼事?
    百度前首席科學家吳恩達幾小時前剛剛在推特上宣布了他的下一個企業Deeplearning.ai,只有一個標誌,一個域名,還有一行「 2017 年8 月」的字樣,預示了發布日期。有趣的是,Deeplearning.ai 的域名似乎已註冊到百度位於矽谷森尼韋爾的研發機構——也就是吳恩達此前工作過的同一個辦公室。
  • 高考史上最大作弊案,三分之一考生參與,換做現在可能嗎?
    高考史上最大作弊案,三分之一考生參與,換做現在可能嗎?每年高考中,總有一部分學生會鋌而走險,選擇在高考中作弊,在高考的歷史中,有過這麼一次作弊,那是有史以來最大的作弊,一個縣三分之一的學生都參與了其中。
  • 最強大腦作弊黑幕過程回顧 2019最強大腦王易木作弊事件
    近日,《最強大腦》節目選手疑似作弊的爭議事件不斷升級,節目組最新回應是「謠言止於理性,等待司法結果」。後有網友爆料《最強大腦》魏坤琳玉製片人桑潔有不正當關係,4月11日晚,選手梅軒宇發布道歉聲明,承認捏造魏坤琳和桑潔存在不正當關係,網傳截圖和偽造信息均來源於其他網友處,並指關於魏坤琳作弊也是不實信息,現已認識到行為觸犯了法律,鄭重道歉。《最強大腦》作弊黑幕全過程是什麼?復盤下到目前為止的事件進程。
  • 天才學霸跨國作弊,利用時間差,被考官發現帶回調查
    Lynn(茱蒂蒙·瓊查容蘇因 飾)是個天才女學生,父親是一名教師,由於出生家境貧寒,多次轉學拿獎學金念書,而這次轉學也是跨國犯罪的契機,入學第一天認識了富二代同桌Grace(依莎亞·賀蘇汪飾)。整個學期的考試計劃就是作弊,學生成績不能突飛猛進,多次考試慢慢進步才不會露出破綻。而這次沒有這麼幸運,試卷分為AB兩種考卷,班裡的同學班中這次作弊成績凸顯,被班克舉報後查出Lynn幫助作弊的嫌疑,並取消Lynn參加新加坡獎學金比賽。
  • 王易木事件是咋回事呀?作弊事件竟牽出偷情事件
    高智商之間的比拼,也讓觀眾看的十分火熱,但是節目竟然被曝出內幕,不僅如此,在作弊事件後,竟然牽扯出偷情事件。兩件事情鬧得很大,持續登上半個月熱搜,可見影響有多大,來了解一下王易木事件是咋回事呀?    王易木事件是咋回事呀?   來了解一下王易木事件是咋回事呀?節目中,有八位選手選擇了雲隊,但云隊只能留四個人。所以八個人將通過比拼來決定,誰能在雲隊。王易木率先進入雲隊,是第一位雲隊選手。
  • 吳恩達被diss了
    這條搞了個大新聞的消息緊扣公眾痛點,直指放射科醫師的失業問題,獲得了1400次轉發,2400個贊。結果,反差出來了。同樣一個團隊,去年發布ChexNet時,暗示放射科醫師面臨失業。而最近這個MURA模型的表現意味著:放射科醫師的工作,似乎又保住了。
  • 中國漁船撞上日本驅逐艦,日艦船身出現大窟窿,防衛省介入調查
    撞船事故發生的機率應當是相當小的,何況還是在寬闊的海面上,隨著科技的進步,普通的漁船也會配備GPS等導航設備,一般不會出現突發事件。除非是面臨非常惡劣的天氣,比如大霧、強風等。再者,就算漁船撞上軍艦,也不會導致堅船利炮受損,反而是漁船損毀嚴重。
  • 徐寶寶事件第三方調查
    之後的幾天裡,「徐寶寶事件」影響力擴大,成為公共事件,兩次調查,結論相反,最終家屬要求得到支持,該事件也成為繼「躲貓貓事件」、「釣魚執法」後第三件引入「第三方調查」的公共事件。他沒有想到,幾天後,帖子敘述的內容就成了南京最受關注的公共事件。  版主的刪帖並沒擋住「徐寶寶事件」在論壇裡的發酵,「幾個ID還在積極地發帖,並轉貼到其他版,網友跟帖也積極,我上網的時候看到就會刪掉,但並沒有特別針對這個帖。」
  • MBA考試作弊猖獗 監考老師手持儀器定位作弊者
    其次,試題的客觀題比重過高,這也給作弊留下了很大空間。比如英語,客觀題佔到60分,翻譯15分,小作文10分,大作文15分。從他當日通過「作弊克」聽到的作弊傳送答案來看,作弊團夥傳送的答案將除大作文外的所有題目「一網打盡」,比例高達85%。  作為一名老師,王明希望能為避免「作弊」提供一些建議。他認為MBA從考試到招生錄取都有很多可改進的地方。
  • 中國科學院院士:基因編輯嬰兒事件 許多疑點尚未明了
    然而事件過去近兩個月,除了此前媒體報導的「衛生部門已介入調查」之外,沒有任何進展的披露。日前,北京青年報記者專訪生命科學研究領域的業內人士、中科院院士邵峰,試圖對該事件及背後要素進行科普意義的探究。此前,邵峰曾就「基因編輯」事件發聲,認為該技術「沒有什麼科學創新,只有對倫理和道德無底線的突破,亟待需要在法律、倫理上有一個清晰的界線」,並希望相關部門應對此立法。
  • 網友「喊話」百度:賺錢可以 請有底線!(圖)
    在昨天的報導中,有網友已經披露百度私自指定吧主人選,隨意封禁網友發言並從貼吧植入的各色廣告和軟文中獲利,一名已經擔任超過三年吧主的女生在接受記者採訪時表示,單以她負責的貼吧為例,這些廣告收入基本都直接進了百度的腰包,她和其他吧主並未分得過任何收益。「現在打開貼吧,橫亙在第一排的推廣(廣告),右側兩個,頂端一個。退回貼吧首頁,夾在各個帖子中間有三個推廣,右側兩個。
  • 深航客機在攀枝花落地發生不安全事件 官方介入調查
    來源:澎湃新聞上遊新聞10月16日消息,10月16日,上遊新聞記者從多個信息源證實,當日下午14點30分許,深圳航空ZH9247航班在四川攀枝花保安營機場落地時,客機在機場跑道外同機場設備發生接觸,造成飛機和機場設備受損,事件沒有造成人員傷亡,深航後續返回西安航班取消。
  • 世界首個基因編輯嬰兒刷屏:合法嗎?必要嗎?3大疑點引爭議,監管已介入調查
    清華大學愛滋病綜合研究中心常務副主任張林琦對此評價道:「這事件已經遠遠超出了技術問題的範疇,後果不可預測,一定是倫理爭論的焦點。即使技術是100%可靠,人類是否可以或應該編輯自己的生殖細胞和胚胎,(看到這個消息)絕大多數人肯定大腦一片空白,包括我自己。」
  • 高考歷史上最大作弊案:全縣三分之一學生參與,雷同試卷五百多份
    高考歷史上最大作弊案:全縣三分之一學生參與,雷同試卷五百多份我們都知道,高考是一場全國性最大型的考試,如果喪失公平公正的話,那麼高考的權威性必然會大打折扣。但是,在我國曾經發生了一件高考作弊案,當時震驚全國,可以說是我國高考歷史上最大的作弊案。在九十年代的時候, 雖然說當時對於高考作弊的懲罰已經很嚴重,但是依舊有不少人鋌而走險去想著作弊,由於當時的科技水平並沒有現在這麼高,考場內也沒用安裝攝像頭,因此考場的紀律全都是由監考老師負責的。
  • 吳恩達 NIPS 2016:利用深度學習開發人工智慧應用的基本要點(含...
    今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • "銀杏葉"事件發酵的背後
    截至目前,國家食藥監總局已經連續發了3次通稿披露非法銀杏葉提取物的調查進程,而隨著事件發酵,關於銀杏葉提取物、植物提取物風險的潘多拉盒子也隨之打開。   北京鼎臣醫藥管理諮詢中心負責人史立臣向記者介紹,在銀杏葉藥品事件持續發酵的背後,是國家亟待規範和整治的植物提取物市場。   據了解,植物提取是中成藥生產和質量管理的關鍵環節,其產品主要應用於藥品、保健品和食品。植物提取能力在一定程度上也決定了藥品的藥效。