很多人問我,蟬遊記當年是怎麼冷啟動的。
遊記產品的冷啟動太他媽難了。
寫遊記本身是件極低頻次,極高成本的事情,還需要充足的「情緒」來醞釀,通常只在旅行剛剛結束後有這樣的情緒,時間窗口極短一瞬間。並不是說我上去一拉,人家就給個面子來寫篇遊記好嗎——誰給你這麼大的面子,花4-8個小時跑來素昧平生的新網站寫遊記?憑什麼?
何況蟬遊記網站的創新交互有一點學習成本,上手還需要一定的耐心。
一開始,我們的運營團隊收集了近千個種子用戶名單,挨個去拉,成功率近乎於0。崩潰了。
然後去微博上搜索「剛結束旅行」的用戶拉人,成功率還是近乎於0。再次崩潰了。
因為我的個人風格,再加上天使輪確實也沒什麼錢,當時沒用錢開路,也就是不用現金獎勵,這個獎勵那個獎勵去吸引用戶來寫遊記,硬拉的下場極慘,差點掛在這裡。
我只好動用萌系產品技能,做了一個過渡產品叫「旅行推」。
旅行推這個網站吶,只做一件事,抓取「正在旅行中的人」,所發的「關於這次旅行的微博」,按目的地展示出來,樣式是爛大街的瀑布流。這件事情的難點在於,如何鑑定這是一條旅行分享微博?
我好想去巴黎哦算不算?
我家住在巴黎公社小區算不算?
我買了個包牌子是香榭麗算不算?
當然不算。必須得是正在旅行中的人,在旅行中實時發送的,與這次旅行相關的微博才算。
到現在為止,似乎只有旅行推做到了這一點。
我設計了一套算法,過濾掉髒數據,僅保留有效數據,後來又加入了另外9道過濾規則,以及不斷調試關鍵字庫,最後達到了驚人的……97%有效率。
抓取100條微博,目測97條有效。
這樣做,目的地必須限制在典型的「旅行目的地」,以國外為主,國內則是西藏,新疆,內蒙這種微博用戶較少的地區。廈門,成都,杭州都不行,北上廣更不行。即便有此限制,抓取數量也達到了每天3000條左右,相當於每天發現2000個以上的,有記錄和分享意願的中長途旅行用戶。
神奇的抓取引擎默默地跑了半年,直到新浪修改搜索算法,抓取失效為止,大約抓了30萬目標用戶過來。然後我們就一個個去勾搭嗎?
Too young, too simple, sometimes naive.
蟬小隊的運營妹子設計了一套神奇的自動對話機制,印象裡大約是這樣的:
機器人評論:在嗎?
對方:在(不管回答什麼,都觸發下一條評論)
機器人評論:我們是一個年輕的創業團隊,有一個不情之請。
對方:xxxxx(不管回答什麼,都觸發下一條評論)
機器人評論:邀請你來寫遊記blablabla
機器人評論:邀請你來寫遊記blablabla
(這裡專門拆成2條評論發,更接近真人對話風格)
對方:xxxxx(不管回答什麼,機器人再無回復)
直到機器人關停三年後的今天,還能遇到有人跟我說,你們的運營人員曾經在微博上拉過我寫遊記,當時太忙,不好意思沒來哦。
我:呵呵,呵呵呵呵,呵呵呵呵呵呵,不客氣不客氣。
在我的記憶裡,只有一兩個人識破了這個機器人謎題,其他人受到了狡猾的蒙蔽……於是,30萬目標用戶+不知厭煩的機器人,完成了蟬遊記的冷啟動。
曾經,我曾經想公開這套微博過濾算法,僅僅因為「嘚瑟」。但既然我還在做旅行產品,終歸是不方便搬起石頭砸自己的腳。哪一天我不做旅行產品了,再公開算法吧。
………………
………………
………………
………………
………………
上面這部分是2015年8月寫的,一年後,我還真他媽放棄了旅行賽道,也就兌現承諾公開了算法。
關鍵是四個字:「兩次命中」。
首先,為每個目的地建立一個知名景點庫。
當用戶5天內發布的微博中,至少2條提到同一個目的地的入庫景點,我就認為他正在旅行中。
說穿了是不是簡單到哭出來?
還有很多附屬規則。比如說,國內用戶常居的旅行城市是不能抓的,比如杭州和西安,但西藏和麗江可以。又比如說,還要建立一個黑名單,把「凡爾賽花園」這種拿國外景點來裝逼的樓盤名稱給過濾掉,人工建黑名單花了我很多的時間。
類似的過濾規則有十幾道,十幾道啊十幾道。調試到最後能做到97%的準確率,判斷誰誰誰正在旅行中——當然是中長途旅行目的地,恰好和蟬遊記的定位一致。