看數學天才如何利用交友網站找到真愛 | 網際網路數據資訊網-199IT |...

2020-12-16 199IT

 

男主角麥金利(騰訊科技配圖)

凌晨三點,在加州大學洛杉磯分校(UCLA)數學系大樓五樓的一個擁擠小隔間裡,只有一隻燈泡和一臺計算機的屏幕發出光亮。克裡斯·麥金利(Chris McKinlay)正在為他的博士論文《大規模數據處理和並行數值方法》跑程序。計算機發出嘎嚓聲,他點擊打開第二個窗口,檢查了一下他在交友網站OkCupid的收件箱。

約有4000萬美國人使用Match.com、J-Date和e-Harmony等交友網站尋找浪漫戀情,35歲的麥金利就是其中之一。他身材瘦高,頭髮凌亂,自從九個月前跟前女友分手之後,他就一直都在尋找新戀情,但迄今為止都是徒勞無果。

OkCupid號稱可以用算法找到跟你匹配的約會對象,麥金利已經向數十位匹配度不低的女性發送了私信,但大多石沉大海。只有6個人跟他見過面。

OkCupid的運作方式

2012年6月的那個清晨,當麥金利的編譯器在一個窗口中顯示機器代碼,他的交友帳號在另一個窗口中默默發呆時,他突然意識到自己做錯了一件事:他之前就像其他普通用戶一樣使用網上交友服務。這時他覺得,自己應該像一個真正的數學專家那樣去尋找約會對象。

OkCupid是哈佛大學數學專業的學生在2004年創建的,它最初吸引用戶的地方是可以使用算法來匹配會員。會員需要做大量的多項選擇題,這些問題涵蓋了包括政治、宗教、家庭、愛、性、智慧型手機在內的方方面面。比如:

「以下哪項最有可能吸引你去看一部電影?」

「宗教或神對你的生命有多重要?」

問題總共有數千個之多。平均而言,一個用戶會挑選其中350個問題來回答。此外用戶還可以指定只接受潛在伴侶的何種回答,並用打分的方式說明這個問題對自己有多麼重要:0代表「不重要」,5代表「必不可少」。

然後OkCupid的匹配引擎就會使用這些數據來計算兩個人的匹配度。百分比越接近100%就越匹配。100%表示你們是靈魂伴侶。

麥金利的問題

麥金利跟洛杉磯女性的匹配度簡直糟糕透頂。因為OkCupid算法所使用的問卷問題,僅僅是雙方都選擇回答了的問題,而麥金利在選擇回答哪些問題時比較隨性。事實證明,他選擇回答的這些問題很多人都不會選。

洛杉磯大約擁有200萬女性,其中約有8萬人使用OkCupid交友服務。但是查看一下麥金利的匹配列表,只有不到100名女性跟他的匹配度達到90 %以上。在交友網站上,匹配度就相當於可見度,麥金利的可見度如此之低,跟鬼魂也差不多少。

麥金利意識到,他必須增加跟他匹配度在90 %以上的女性人數。如果可以用統計抽樣來確定哪些問題對他喜歡的那類女性來說很重要,他就可以修改自己的個人帳戶資料,老老實實地回答這些問題,不再去操心其他問題了。這樣一來,可能適合他的每個同城女性都會出現在匹配列表裡,而不適合他的女性一個都不會出現。

從中文繫到數學系

對於一名數學專家來說,麥金利的經歷有些不同尋常。他在波士頓市郊長大,2001年從明德學院畢業,獲得了中文學位。當年八月,他在紐約做兼職,幫助世貿中心北樓第91層的一家公司把中文翻譯成英文。五周後9.11事件發生了,第一架飛機在上午8:46撞上世貿中心北樓。幸而麥金利那個時候不當班,正在家睡覺。

「自那之後,我問自己,我真正想做的事情是什麼。」他說。一位朋友將他招進了著名的「麻省理工21點小組」的一個分組,在接下來的幾年中,他在紐約和拉斯維加斯之間飛來飛去,靠算牌賺到了6萬美元的年收入。

「麻省理工21點小組」由麻省理工學院和哈佛學生於1979年組建,曾多次打敗拉斯維加斯和大西洋城的眾多賭場。Blackjack又稱21點,是各地賭場最熱門的牌桌項目之一。這在很大程度是因為21點並不完全是碰運氣,而要求玩家擁有對數字的敏銳反應、嫻熟的算牌技術和沉著冷靜的心理。

這段經歷激發了他對應用數學的興趣,他開始攻讀數學碩士學位,然後又繼續讀博。「數學系的學生在很多情況下都可以用到自己的專業,」麥金利說。「比如玩一些新遊戲,『三張牌牌九』之類的,然後回家寫一些代碼,找出一個策略來打敗它。」現在,他要為了愛情做同樣的事情。

用假帳戶搜集數據

首先,麥金利需要數據。就在那天凌晨,他的論文任務繼續在另一個窗口裡跑的同時,他設置了12個OkCupid假帳戶,並編寫了一個Python腳本來管理它們。這個腳本會搜索麥金利的目標人群(25至45歲之間的異性戀和雙性戀女性),訪問她們的網頁,並在她們的個人資料裡搜集所有可用信息:種族、身高、是否吸菸、星座,所有一切。

為了獲取問卷數據,他必須做更多的偵查活動。在OkCupid上,只有當你自己回答過某個問題時,你才可以看到別人對這個問題的回答。於是麥金利編寫了bot機器人來隨機回答每一個問題(假帳戶的目的不是用來吸引約會對象,所以它們是怎麼回答問題的並不重要),然後把目標人群的回答搜集到自己資料庫中。

麥金利滿意地看著機器人忙忙碌碌。但是,在搜集了約1000份個人資料之後,他遇到了第一個障礙。 OkCupid採用了一個系統來防止這種數據收集活動:它可以輕而易舉地發現這種連續、快速的活動。麥金利的機器人一個接一個地被禁了。

克服第一個障礙

他必須訓練這些機器人,讓它們的活動顯得有人味。

麥金利找到了他的朋友山姆·託裡西(Sam Torrisi)。託裡西是個神經學家,最近跟麥金利進行了「技能交換」:他教麥金利音樂理論,麥金利教他高等數學。

託裡西也是OkCupid的用戶,他同意讓麥金利在自己的計算機上安裝間諜軟體,跟蹤自己使用這個網站的方式。有了這種數據,麥金利就可以模仿託裡西的點擊和打字速度給機器人編程了。

麥金利從家裡搬來了第二臺計算機,把它接到數學系的寬帶上,讓機器人每天24小時不間斷地運行。三周後他就從全美各地2萬名女性用戶那裡搜集了600萬條問題和回答。

麥金利現在一頭扎進了這些數據,完全把博士論文當成了副業。本來他就已經常常在小隔間裡過夜,現在他幾乎不回公寓了,完全搬進了這個小隔間。到了睡覺的時候,只要在辦公桌上鋪上薄薄的床墊,就可以躺上去了。

女性用戶的七種類型

麥金利的計劃要想奏效,就必須找出問卷數據中的規律——根據數據的相似性,把女性分為大致幾個類型。

貝爾實驗室(Bell Labs)有個名叫K-Modes的算法,最早是在1998年投入使用,用來分析病變的大豆作物,它可以把具有相似性的數據凝結在一起。麥金利對它做了一些微調,以便調整結果的粘度。然後他用這個修改後的算法來處理搜集到的問卷數據。

他調整刻度盤,發現了一個點,可以根據2萬名女性的問題和答案,把她們分成七個在統計學上具有明顯區別的類型。「當時我欣喜若狂。」他說。

他給機器人重新分派了任務,以便搜集另一個樣本: 5000名在過去一個月內登陸過OkCupid的洛杉磯和舊金山女性。然後他再用修改過的 K-Modes算法處理她們的問卷數據。結果這些女性用戶也以同樣的方式被劃分成七個類型,證實他的統計抽樣方法確實有效。

目標鎖定兩種類型

在這一步,麥金利的任務是選擇最適合自己的類型。他從每個類型中抽取了一些個人資料來查看。有一個類型太年輕,有兩個類型太年長,還有一個屬於基督教徒類型。

有一個類型讓他很感興趣:她們大多二十多歲,看上去特立獨行,參與音樂和藝術活動。麥金利希望在這個類型中大海撈針,找到他的真愛。

實際上,還有一個類型看起來也很酷——年齡稍大的女性,是創造性工作專業人士,比如編輯、設計師。他決定兩個類型都試試。於是他創建了兩份個人資料,分別為兩個類型做了優化。

他對這兩個類型女用戶的文字信息進行了挖掘,以便了解她們對什麼東西感興趣。他發現教學是一個熱門話題,於是他寫了一篇自我介紹,強調自己是一名數學老師。

精準營銷

但是,最重要的是問卷問題。他挑選出在這兩種類型中最流行的500個問題,誠實地填寫了答案——他不想把自己未來的關係建立在計算機生成的謊言上,但是他會讓計算機算出應該如何給每個問題的重要性打分。他使用一種名為「自適應提升」(adaptive boosting)的機器學習算法來計算最佳分數。

就這樣,他創建了兩份個人資料。一份上傳了他攀巖的照片,另一份上傳了他在一次演出中彈吉他的照片。

「不管未來的計劃如何,眼下更吸引你的是什麼?是性還是愛情?」這是500個流行問題中的一個。回答當然應該是「愛情」。但他按照「自適應提升」的結果,對於較為年輕的A組,給該問題打分為「非常重要」,而對於年齡稍大的B組,他則給該問題打了5分,即「必不可少」。

當回答完最後一個問題並給它打分之後,麥金利在OkCupid上進行了搜索,按照跟自己的匹配度來排列洛杉磯女性用戶。第一頁的女性跟他的匹配度高達99%。他繼續向下滾動頁面,直到一萬名洛杉磯女性之後,他仍然跟她們有90%以上的匹配度。

私信滾滾而來

要引起這些女性的注意,麥金利還需要做另一件事。 在OkCupid上,每當有人瀏覽你的個人資料時,你就會收到提醒。所以麥金利寫了一個新程序,專門去查看跟他的匹配率最高的女性用戶的頁面。

這個程序按照年齡順序進行瀏覽:周一瀏覽1000名41歲女性的頁面,周二瀏覽1000名40歲女性的頁面,以此類推,一直到兩個星期後,瀏覽1000名27歲女性的頁面。在這些用戶中,有大約400名女性也反過來查看了麥金利的個人資料。結果私信滾滾而來。

「我到現在為止還沒有遇到過算牌很厲害的人,我覺得你的個人資料很有意思。」一位女性用戶寫道。「我想跟你打個招呼。」

「嗨,你的個人資料確實打動了我,我想跟你打個招呼。」另一位寫道。「我認為我們之間有相當多的共同點,也許不是數學,但肯定有很多其他方面!」

「你真的能翻譯中文嗎?」還有一位問道。「我參加過一個中文培訓班,但效果並不好。」

前三次約會

到了現在,需要用到數學的部分已經完成,只剩下一件事要做了:麥金利必須離開他的小隔間,去跟她們約會。

6月30日,麥金利在加州大學洛杉磯分校的健身房洗了澡,開著他的破舊日產車,去赴第一個約會。希拉(Sheila)是一位網頁設計師,來自A組,即較年輕的藝術類型。他們在回音公園的咖啡館共進午餐。 「這真是可怕,」麥金利說。「直到那一刻之前,這件事幾乎都是一個學術活動。」

這次約會結束時,狀況已經很明顯:雙個人不來電。第二天,麥金利繼續趕赴第二個約會,這次是一個富有魅力的博客編輯,來自B組。

麥金利本打算跟她沿著回音公園的湖浪漫地散散步,但卻發現挖泥船正在湖裡疏浚。她愛讀普魯斯特的作品,對自己的生活感到憂傷。「這個比較負能量。」他說。

第三個約會對象也來自B組,名叫艾莉森(Alison)。他們在韓國城的一間酒吧見了面。她是一個學編劇的學生,肩膀上有斐波那契螺旋的紋身。麥金利喝韓國啤酒喝醉了,第二天在小隔間醒來的時候,經歷了痛苦的宿醉。他在OkCupid上給艾莉森發了一條私信,但她沒有回。

成為約會遊戲中的強者

被拒絕的感覺不好受,但麥金利仍然每天都能收到20條私信。有了計算機算法的支持,他在約會遊戲中佔據了主動地位。

還記得當初,麥金利主動給別人發私信的時候,每發3到5條私信才會獲得一個約會機會。但現在,別人發給他的私信,只要他看不順眼,就一概無視。他只回應那些具有幽默感,或個人簡介很有意思的女性。而且,他只需要簡單地答覆「你看起來真的很酷。想見面嗎?」基本上就能搞定一個約會。

在去赴第20個約會時,他注意到了新的規律:比較年輕的A組女性總是有兩個或兩個以上的紋身,並且住在洛杉磯的東部。在B組,養有中型犬的女性人數格外多。

最初幾次約會時,他還精心做了準備。但是,隨著次數的增加,他把約會形式改成了休閒式的午餐小聚或是喝咖啡,而且常常一天趕赴兩場約會。

提高約會效率

麥金利還為這場馬拉松式的戀情搜尋行動制定了一套個人規則,比如不要喝酒;時間到了就結束約會,不要拖拖拉拉;不要去聽音樂會或看電影。「把注意完全放在對方身上。」他說。「否則效率很低。」

在第一個月,他同時約會A組和B組女性。一個月後,他不想再約會有紋身、住在洛杉磯東部的女性了,因為不想花太多時間在路上。於是他刪除了面向A組的個人資料。

這下子他的效率提高了,但結果還是一樣。夏季即將結束,他赴約的次數超過了55次。每一次約會都被他盡職盡責地記錄在了一個實驗室筆記本上。只有三個人進行了第二次約會,只有一個人進行了第三次約會。

大多數不成功的交友者都會覺得自尊心受損。對於麥金利來說,情況更是雪上加霜。他對自己的計算思路產生了些許懷疑。

真愛現身

這時,他收到了王婷(Christine Tien Wang,音譯)的私信。她28歲,是一名藝術系學生,支持廢除監獄的活動,希望尋找一位6英尺(1.82米)高,藍眼睛,住在加州大學洛杉磯分校附近的男伴。她在這所學校攻讀美術碩士學位。他們的匹配度是91%。

兩人在學校裡的雕塑園見了面,然後從那裡步行到了校園裡的一間壽司店。他一開始就感覺跟王婷很投緣,兩人談論了書籍、藝術和音樂。

王婷承認,在給麥金利發私信之前,她對自己的個人資料進行了調整,而這時,麥金利就把自己用程序和算法尋找女伴的過程原原本本告訴了王婷。

「我覺得這有點黑暗,有點玩世不恭。」她說。「我喜歡。」

這就是麥金利跟88號女士的第一次約會。很快他們又進行了第二次約會,第三次約會。兩個星期後,他們各自暫停了OkCupid上的帳號。

「我覺得,跟OkCupid上其他所有用戶做的事情相比,我只不過多用了一點算法,活動規模更大一點,還使用了一些機器學習技術。」麥金利說。每個人都試圖創建最佳版本的個人資料——他只不過是擁有一些數據來幫助他做到了這一點。

後續發展和反思

麥金利和王婷的第一次約會已經過去一年多了。現在麥金利已經拿到了數學博士學位,是一名數學老師,目前在讀音樂研究生。王婷則獲得了卡達為期一年的藝術獎學金。她時不時回到加州探望麥金利。他們一直在Skype上保持聯繫。

在王婷看來,麥金利用OkCupid找女友的故事很有趣。但是,對於他們的戀情來說,數學知識和編碼技能起到的僅僅是序幕作用。在戀愛關係中,關鍵的是兩人見面之後發生的事。

「真人比個人資料複雜得多。」她說。「所以我們見面的方式可能比較膚淺,但之後發生的一切都不膚淺。那是辛苦培養得來的。」

「並不是說我們匹配度高,就會有良好的關係。」麥金利同意這個看法。「那只是一種讓我們走到同一個房間的方式。我可以利用OkCupid來找到合適的人。」

王婷說:「你沒有找到我。是我找到你了。」麥金利思考了一下,然後承認她說得對。

在一次Skype通話中,麥金利掏出一隻鑽石戒指,把它放在網絡攝像頭前。她答應了他的求婚。

他們不確定會在何時結婚。要找出最佳的結婚日還需要做一些研究。

相關焦點

  • 旅遊批發商如何利用數據挖掘實現差異化? | 網際網路數據資訊網-199...
    全球旅遊批發商Tourico利用數據挖掘技術幫助中國分銷商評估消費者的旅遊預訂行為,從而改善產品和服務質量。全球旅遊批發商Tourico利用數據挖掘技術幫助中國分銷商評估消費者的旅遊預訂行為,從而改善產品和服務質量。
  • 大數據造就老大哥? | 網際網路數據資訊網-199IT | 中文網際網路數據...
    199IT數據中心微信帳戶:i199IT譯者: 紅鼻子cj科技進步日新月異,兩年前完全無法想像的東西,到今天已然成了家常便飯。前途一片光明,卻也難免刺眼。NSA和大數據企業將資料庫資源和計算能力用在了不同的地方,前者用它們來偵查間諜和恐怖分子,後者利用它們來將合適的服務提供給適合的用戶。他們同樣利用了超大型資料庫以及模式識別(pattern recognition)和網絡分析(network analysis)之類的技術手段。
  • 耐克是如何擁抱網際網路和大數據的? | 網際網路數據資訊網-199IT |...
    賽事組織管理平臺RecBob舉辦一場球賽的繁瑣每個經歷過的組織者都深有體會,RecBob就是為了解決這一煩惱而生的,只要在網站上創建一個比賽項目,它就會自動通過客戶端通知你的朋友們,並且還能針對各種突發狀況進行人員調整。利用RecBob,你甚至可以在自己的社區甚至城市內用它組織一屆小規模的「世界盃」。
  • 女性網民消費者研究 | 網際網路數據資訊網-199IT | 中文網際網路數據...
    這肯定是一項讓女人們狂喜,讓男人們痛恨的網際網路創新!它還有一個風騷的名字,叫「撒嬌支付」。支付寶的最新數據顯示,今年6月,這項業務同比增加約六成。使用它很簡單:用戶在進入付款頁面時選擇「代付」,交易平臺會隨即自動生成一串連結,用戶將該連結通過郵箱、旺旺、QQ等方式發送給其他人比如男友、老公後,則由後者來付款。
  • 網際網路營銷效果監測數據體系 | 網際網路數據資訊網-199IT | 中文...
    隨著網際網路的多元化發展,網絡營銷的表現形式也越來越多,如何有效監測和評估網絡營銷的效果也成為現代企業運營推廣的重點。和傳統廣告媒體相比,網際網路營銷的優點之處就在於可實現對營銷效果的追蹤和評估,能夠實時地監測線上營銷活動的效果。在傳統廣告中,只有對廣告的瀏覽,不存在對廣告的點擊之類的反饋。而網絡廣告中,用戶除了對活動廣告的瀏覽外,還有相當一部分轉化為對它的點擊,進而產生類似購買的成功事件,而整個過程用戶的行為都可以利用現有的技術來實現監測。
  • 10款最受歡迎數據可視化工具 | 網際網路數據資訊網-199IT | 中文...
    當然,你可能想像不到這種數據可視化的技術可以追溯到2500年前世界上的第一張地圖,但是,如今利用各種形態的數據可視化圖表幫助用戶減少分析時間,快速做出決策一直扮演著重要的作用。可以通過網站訪問者進行調整的能力,互動點,相應地更新數據集。可以利用jqPlot來製作漂亮的線狀圖和柱狀圖,jqPlot提供Tooltips,數據點高亮和顯示功能。7、D3.js
  • 山寨也能成大器 | 網際網路數據資訊網-199IT | 中文網際網路數據研究...
    199IT數據中心微信帳戶:i199IT翻譯:劉鑫一般認為,真正的企業家應當避免模仿,努力做到真實原創。我不相信這種策略具有廣泛的商業合理性。「山寨」的好處的的確確受到了低估。還是那句話,重要的不是點子,而是如何執行點子。我們PizzaExpress曾經有一家名為Pizzaland的競爭對手,它開設的一家分店無論外觀還是菜單都與我們的相似。我們提起訴訟,輸掉了官司——但贏得了競爭。Pizzaland生意慘澹,品牌沒多久便銷聲匿跡,PizzaExpress卻實現規模翻番。模仿比白手起家速度更快、成本更低、風險更小。
  • 社交媒體40年發展史 | 網際網路數據資訊網-199IT | 中文網際網路數據...
    在大家耳熟能詳的 Facebook、Twitter 之前——這裡不談中國或其他國家的模仿者——類似的同學交友網站有 Classmates,早期搜尋引擎有 Ask.com,博客工具有 Blogger 和 LiveJournal。等等。是的,「社交媒體」的發展史有足夠漫長的 40 年歷史,既不是 Facebook、Twitter 開始,更不是從人人網、飯否、微博開始。
  • 運營、數據、產品經理必須要知道的幾個實用網站,建議收藏
    俗話說「工欲善其事,必先利其器」,作為一個網際網路從業者,他手裡最厲害的工具就是網際網路本身。利用網際網路提高工作效率是很多人想做卻又找不到方法的一件事,今天我們的文章就來介紹一般人不知道的、超實用的幾個網站。
  • 北京大學:2015年社交網絡數據分析與應用 | 網際網路數據資訊網-199...
    1.1億人;網際網路媒體和社交網絡是Web2.0時代兩個非常重要的應用,那麼一個自然的問題是這兩個領域將會如何互動發展?綜上我們認為QQ音樂雖然是利用社交關係進行音樂推薦的先驅者,但是在利用網絡數據的層面上仍有很大的改進和提升空間。1.2 基於社交網絡的音樂推薦在此我們給出如何利用網絡數據對用戶進行推薦的技術思想。
  • ...book仍然是最受歡迎的平臺 | 網際網路數據資訊網-199IT | 中文...
    青少年和網際網路(每天花費在網絡設備的平均時間)網絡娛樂對青少年來說很重要,看視頻短片是最受歡迎的網絡活動,半數人正在使用視頻點播服務。青少年平均每天花1.15小時收看網絡電視。青少年不太願意為網絡內容付費,但是1/5的青少年每個月收看 Netflix。音樂方面,SoundCloud比Spotify更受歡迎。
  • ...達到65.8% | 網際網路數據資訊網-199IT | 中文網際網路數據研究...
    199IT原創編譯        根據SaaS分析應用companyMoat Analytics的數據,大廣告牌展示廣告在PC可視性方面排在第一位。
  • 極光大數據:菜譜app行業研究報告 | 網際網路數據資訊網-199IT |...
    網際網路時代的到來,也使得美食屆的武林秘籍——《菜譜》以一種新的形式飛入尋常百姓家。而現在,更為方便的菜譜類app則成為越來越多的年輕人的美食寶典。從2004年第一家菜譜網站美食天下出現,到2011年第一款菜譜app——美食天下app的推出,再到其後三年間不下10款主流菜譜app陸續出現,菜譜app市場呈現了一個穩步發展的市場格局。
  • 信息可視化在新媒體時代的實踐思考 | 網際網路數據資訊網-199IT |...
    從人類感官的維度去看,信息圖或動態圖形只是通過平面的視覺語言來傳達信息(動態圖像短片或有加上音樂,但主要獲取信息的途徑也是通過視覺)。隨著科技和社會的發展、人類認知能力與審美的提高,人們已經不滿足單單通過平面來獲取信息。如何通過一些新穎有趣的方式去展示信息,是當下我們作為設計者需要思考的問題。
  • ...北京焦灼上海頹廢 | 網際網路數據資訊網-199IT | 中文網際網路數據...
    這個素材主要是三個層面:一是社交網絡類的信息網站上提供的廣泛文本信息,它和我們一般接觸到的純數據最大的區別是,文本信息是一種信息量大且摺疊程度高的信息,其中的分析內容有很大的空間可以去主觀操作、創作。二是社交網絡類網站提供的對某一個信息傳播方式及傳播範圍的指向性數據,這為我們提供了觀測每一個貢獻信息的人之間關係的方式。我們可以通過這些用戶是否對同一件事情發表評論、是否參與同一個活動、是否分享了類似的內容等途徑去構建用戶之間的關係。
  • 谷歌掌門人:網際網路即將消失 | 網際網路數據資訊網-199IT | 中文互聯...
    看高科技500強爭相布局物聯網在1月9日剛剛落幕的2015國際消費電子展(CES)上,物聯網概念成為最大看點之一。智能家居、數字醫療、車聯網等產品的推出,使得物聯網技術真正服務於智能生活。 「物聯網不是趨勢,它是現實。
  • ITWorld:2014年全球最傑出的14位編程天才 | 網際網路數據資訊網-199...
    近日,ITWorld 整理全球最傑出的 14 位程式設計師,一起來看下讓我們膜拜的這些大神都有哪些?(排名不分先後)截止目前,穩居俄編程網站 Codeforces 聲望第一的寶座,在 TopCoder 算法競賽中暫列榜眼位置。  網絡上對 Gennady Korotkevich 的評價:「一個編程神童。」「他太令人驚訝了,他相當於我在白俄羅斯建立了一支強大的編程隊伍」「徹底的編程天才」
  • 數據挖掘的知識類型 | 網際網路數據資訊網-199IT | 中文網際網路數據...
    數據特徵的輸出可以用多種形式提供:包括 餅圖,條圖,曲線,多維數據方和包括交叉表在內的多維表。結果描述也可以用泛化關係或規則(稱作特徵性規則)形式提供例如:利用面向屬性的歸納方法(AOI),在一個商場資料庫(2000銷售)中進行屬性歸納操作,獲得了如下的歸納結果:表2-1   AOI方法挖掘結果表格表示示意描述
  • 2014年20大數據可視化工具及資料 | 網際網路數據資訊網-199IT |...
    巴西的新聞網站Visualoop,這是一家匯集來自網際網路的信息圖表和數據為中心的可視化網站,今年,他們繼續評選出這一年最優秀的大數據可視化相關工具。
  • 酒店如何利用社交網絡開展線下活動 | 網際網路數據資訊網-199IT |...
    而就在很多酒店穿行於各大社交網站之際,一些酒店卻獨闢蹊徑,利用社交媒體來開展線下活動。  通過整合特定社交媒體主題的展覽和社交活動,很多酒店為顧客帶來了圍繞社交媒體主題的真實體驗。該酒店通過社群活動邀請網站Twtvite邀請參與者,並以#luwow為話題標籤將活動分享到了Twitter上。  見面會中還設有遊戲環節,獲勝者將可以獲得喜達屋夏威夷酒店的3天免費入住。這樣的豐厚獎勵讓這些獲勝者變相地成為了酒店的代言人,即使他們不去入住,也會對酒店有所了解。   而前去入住的旅行者很有可能會與他人分享自己的贏得的超值獎勵以及他們的夏威夷之旅。