12306將剔除辨識率低圖形驗證碼

2020-12-04 搜狐網

  昨日,中國鐵道科學研究院,研發12306票務系統的技術人員正在測試手機端的圖片驗證碼的運行狀況。

12306票務系統的研發中心內,一位技術人員正在實時檢測網站數據。

12306購票網站上一些驗證碼引爭議。

  12306驗證碼變遷

  簡單數字數字加字母加減法算式閃爍變形字母(動態碼)中間添加幹擾線的變形字母圖形驗證碼

  目前正值春運購票高峰,網絡上流傳一些調侃鐵路購票網站12306圖形驗證碼的帖子,稱圖形驗證碼難辨識、一些物品名稱沒有聽說過等。對此,12306相關負責人昨日向記者表示,為防止搶票軟體自動識別,相關圖形做了技術處理,但未來將會剔除一些辨識度低的圖片。

  圖片技術處理為防搶票軟體

  「12306的驗證碼,已經擊敗了全國99%的購票者,我已經找不到回家的路了。」近日,春運購買火車票期間,不少網友發帖吐槽12306的圖形驗證碼。網上甚至還流傳一些「奇葩」驗證碼的帖子,列舉出識別明星臉、罕見物品等刁鑽問題。

  昨日,中國鐵道科學研究院電子計算技術研究所副所長朱建生表示,12306購票系統沒有所謂「識別明星臉」的「奇葩」驗證碼,網上流傳的刁鑽問題大多子虛烏有。「我們決不會讓旅客分辨『橘子』和『橙子』。」朱建生說。

  不過,也有一些網友表示,驗證碼清晰度不高,導致放票時間連續選錯,從而錯過了購票。朱建生表示,在春運返程訂票高峰12月15日前,還將對驗證碼中數萬張圖片進行優化,剔除一些辨識度不高的圖片,提高圖片的清晰度。

  「為了防範搶票軟體的自動識別,我們會對圖片做出微調、旋轉、切割的處理。這樣做主要是為了在方便旅客購票和打擊搶票軟體中尋找平衡。」朱建生說。

  部分網友吐槽一些圖形驗證碼因為生活環境和習慣問題,「南方人不認得北方人的物品,北方人也不認得南方人的物品」。朱建生解釋稱,12306圖形驗證碼選擇的都是生活中常見的物品,由於地域原因,「南方人沒見過或北方人沒見過的,或各地叫法不同的,未來在優化時都將進行篩除。」

  「圖形驗證碼有利於普通人訂票」

  朱建生介紹,後臺數據顯示,今年網站購票的平均排隊等待時間僅為1.8秒,系統運行穩定,運行效率大幅提升。同時,對於驗證碼的正確識別率,朱建生表示,正確填寫圖形驗證碼的機率在70%左右。

  12月9日10時的相關分析圖顯示,該時段,共有44萬人輸入圖形驗證碼,其中有33萬人輸入正確,正確率在75%。今年春運購票最高峰的12月8日,當日11時,旅客驗證碼輸入的正確率是69%。

  「登錄的人少了,成功出售的票數增加了,這說明無效地、重複地登錄網站的少了。」朱建生表示,過去的數字字母識別碼,一些搶票軟體和公司開發的瀏覽器很容易進行分析,並自動跳過驗證步驟。在人眼識別需要2秒的情況下,機器僅用0.1秒就能識別。「在尖峰時段,相隔這樣的時間,也會造成旅客買不到票。」

  朱建生說,圖片識別對普通人而言更加便利,人腦更容易建立問題和圖片間的聯繫,而機器則有一定困難。

  購票時間縮短至開車前半小時

  據中國鐵路總公司統計,自11月26日發售春運第一天車票起,截至12月9日,鐵路部門共發售車票1.3億張,同比增長9%。近九成通過網絡訂票成功。

  今年,鐵路部門還將採取多項新舉措方便學生、務工人員等群體購票。目前,鐵路部門已累計發售節前學生票804.8萬張,同時已兌現各院校通過網際網路提報的學生團體往返票計劃。

  「從今日起,未購買到車票,也未參加院校統一辦票的學生仍可通過鐵路各渠道零散購買明年1月10日至2月29日期間的學生往返車票。」中國鐵路總公司運輸局營運部副主任黃欣表示。

  為方便務工人員購票,鐵路部門今年取消了5人成團的限制,單個旅客也可申報購票計劃,目前鐵路部門正在受理用工企業和零散務工人員提報的春運期間往返購票計劃,將於12月15日完成計劃兌現。

  12月16日-25日,用工企業可登錄務工人員團體票辦理網站查詢結果,零散務工人員可根據手機簡訊提示,到鐵路任意窗口憑乘車人二代身份證原件辦理支付並取票。

  此外,鐵路部門今年還將網際網路購票時間由不晚於開車前2小時調整為不晚於開車前30分鐘,同時推出了變更到站服務,在列車上提供了聯網升座服務等。

  焦點

  驗證碼技術公司否認準確率8%

  公司負責人回應質疑,稱圖形驗證碼能抵禦大部分黃牛;圖庫會不斷增替

  正值春運搶票潮,12306購票系統推出的圖形驗證碼飽受吐槽,部分網友將矛頭指向為該系統提供驗證碼服務的企業,質疑「圖形驗證碼」方式未完全阻擋黃牛,還貼出黃牛黨購票的訂單圖。另有網友跟帖稱,這一技術並非原創而是抄襲谷歌。此外,還有網友稱官方未披露相關招標項目和費用等細節。

  對此,新京報記者了解到,為12306系統提供圖形驗證碼服務的是杭州微觸科技有限公司。該公司官網顯示,除鐵路12306外,其用戶一欄中還包括「中國郵政」、「金山快盤」等圖標。

  該企業的工商信息資料顯示,杭州微觸科技有限公司自2012年9月成立並開始營業,註冊資本為30萬元人民幣,法定代表人為宋超。新京報記者檢索發現,宋超名下還有一家名為北京點觸互聯科技有限公司的企業,於12月3日剛剛成立,註冊資本為100萬元。

  對於網友的質疑,昨日宋超表示,除偶爾有較難識別的圖片外,圖形驗證碼能夠抵禦大部分的黃牛。

  1 圖形驗證碼資料庫洩露?

  圖片數量並非固定,為動態增替

  據知情人透露,12306官網推出圖形驗證碼,原本是為了攔截技術黃牛,「但實際上只是攔截了一部分。」

  據其透露,圖形驗證碼推出沒多久後,就有人將圖形驗證碼後臺資料庫竊取,並建立了「打碼平臺」。黃牛購票時,只需通過打碼平臺打碼,即可繞過圖形驗證碼這一關卡。其稱目前打碼平臺的打碼識別率已超過90%。

  他介紹,黃牛每打碼一次,就需要付1分至5分不等費用給打碼平臺,而黃牛每購買一張票,通常需要打碼十幾二十次,多的時候打碼上百次。

  同時,近日360瀏覽器也宣布,已全面攻破了12306圖形驗證碼,實現了全自動識別技術,並首次公布了581種12306圖形驗證碼大數據。

  對此,杭州微觸科技有限公司負責人宋超表示,圖片的數量不是一個固定的數字,是不斷動態增替的過程,會「自己不斷通過用戶的使用數據來更新。」他介紹,系統每天都會抓取大量的圖片,「通過用戶的選擇,用戶驗證的過程,會自動幫助系統通過機器學習獲得新的圖庫,安全性會隨著驗證量的提高而自主提升。目前我們已經通過驗證系統自動標示了近千萬的精準圖片,用戶的每一次驗證都在幫助人工智慧在圖像識別領域添磚加瓦,訓練機器學習。」

  2 一次性準確識別率僅8%?

  網傳「奇葩」驗證碼為PS合成;後端數據顯示成功率非常高

  按照360瀏覽器提供的大數據,12306網站的購票驗證碼一次性輸入準確的比例為8%,兩次輸入準確的比例為27%,三次甚至4次以上輸入準確的比例為65%。

  360技術人士稱,在12306推出複雜驗證碼時,他們通過技術手段對其進行集中統計後發現,其一次識別通過率處於不穩定的狀態。部分生僻圖片難以辨認和12306進行的不合適的圖片處理,造成整體識別率降低,在一些時段上,識別率甚至不足5%。

  技術人士表示,從技術上講,這種方式具有一定的創新性,複雜的圖形驗證碼,提升了自動識別的技術門檻,但其圖片質量較差,再加上有一些生僻且容易混淆的圖片以及不合適的圖片處理,造成用戶體驗較差。客觀來說,12306複雜驗證碼確實對打擊黃牛起到了一定的作用,例如其對部分驗證碼進行模糊顆粒化處理,可以防止黃牛採用專用搶票軟體來刷票。

  針對部分網絡公司提出的驗證碼成功率低的情況,宋超稱,公司點觸驗證碼的產品相對成熟,後端數據顯示成功率非常高,除部分特別難識別的圖片外,網傳的一些「奇葩」驗證碼圖片幾乎均為PS合成製作。

  3 與鐵道部門合作前後股權變動?

  創業公司有人離開有人加入很正常

  有網友指出,鐵路系統開始使用圖形驗證碼是在今年3月份左右,而該公司作為技術提供方,在鐵道部門開始使用圖形驗證碼前後,公司股權立即發生變動,「大致為刪除一人,增加一人。」

  宋超在今年5月份接受媒體採訪稱,每個創業公司都會經歷瓶頸,之前有一段時間公司發展困難,資金流出現緊張。一名同學看不到希望,跳槽走了。

  「創業公司很苦,有的因此離開,也有因為願意一起朝著目標努力而加入,是很正常的事,」他稱,現在後臺可以支持起每天3億以上的請求,「系統比往年一定要增強,」他們目前還在吸納更多的技術人才加入,在驗證安全、帳戶安全、密碼安全和行為安全方面,完成用戶信息安全保護的全面保障。

  4 圖形驗證碼技術是否抄襲谷歌?

  自稱2012年提出圖標式驗證碼,谷歌2015年提出

  有網友稱,這種圖形驗證碼技術並非原創,而是抄襲谷歌。

  據多家媒體此前報導,2011年,宋超在哈爾濱工程大學念研究生時發現了驗證碼的「BUG」,此後,宋超與其他幾名學技術的同伴憑藉自主研發的「點觸驗證碼」和「點觸雲安全系統」參加新媒體創業大賽獲獎,得到數百萬元的天使投資,此後他休學並成立了杭州微觸科技有限公司。

  據報導,「點觸驗證碼」是將傳統驗證碼中模糊的背景換成清晰圖片,上面是隨機排列的標識(漢字、數字、英文字母、有意義的圖標等),用戶通過按照要求點擊(或者觸摸)圖片上指定的位置,完成驗證。該項目已經擁有3項專利。

  「我們在2012年提出了圖標式驗證碼、圖文驗證碼和滑動驗證碼和旋轉式驗證碼,結合行為安全控制,並一直在優化演進,目前有5萬多家網站在使用點觸的服務,谷歌是2015年初才提出的圖標驗證,說我們抄他們的不是冤枉嗎?」宋超稱,微觸很早即開始進行點觸驗證碼的開發工作,自2012年開始公司化運營,現在已經在北京建立了公司,專注於用戶信息安全和隱私安全。

  聲音

  如樣本足夠存破解可能

  網際網路專家史文勇認為,圖形驗證碼技術確實比平時的文字驗證更加複雜,但他並不認為圖形驗證能夠起到實在的作用,「有些軟體能夠自動將所有出現的圖片配對好,很難說能夠防止黃牛刷票。」

  他稱,在利用相關軟體刷票能夠比常規買票速度更快的情況下,一些購票者也會尋求軟體的幫助。

  「人多票少,有一些技術人員刷票能比個人更早買到票,任何工具都無法百分百防止。」梆梆安全創始人兼CEO闞志剛稱,實際測試表明,藉助於谷歌等巨頭的智能識圖技術,能夠識別大部分圖片的涵義,準確率達85%,如果採集樣本數據足夠大,確實有破解圖形驗證碼的可能性,一旦圖形驗證碼被黃牛破解,他們就可以繼續刷票。

  他表示,確實圖形驗證碼在識別上增加了難度,但破解難度上面並沒有革命性的改變,應該建立多種聯合機制抵制黃牛刷票行為。

  追訪

  訂票高峰會「癱瘓」嗎?

  每秒可承載上萬訪問,高峰期運行順暢

  昨日,記者隨中國鐵道科學研究院相關人員參觀了12306購票系統的後臺。監控大廳的顯示屏上,顯示了鐵路總公司和鐵科院兩個生產中心的實時運行數據。這些數據包括網站、手機APP的實時登錄人數,購票支付情況、車站取票情況等。

  「春運期間,購票數據每半小時就會出現一個尖峰,這顯示了我們每天21個放票時間段的高峰購票情況。」中國鐵道科學研究院電子計算技術研究所副所長朱建生告訴記者,系統從每天7點開始運行,一直持續到24點停止支付。

  朱建生介紹,12306網站每秒鐘可承受上萬次訪問並保持系統平穩運行。「12月8日高峰期,全天16個小時訪問量是3600萬,到每秒鐘不到1000次訪問,這完全在網站設計的承受範圍內。」

  同時,據12306後臺系統相關數據,今年12306網站在12月8日最高峰當天登錄用戶達3600萬,旅客成功購票數是608.7萬張。而去年在購票高峰期,登錄用戶有5600萬,售票僅為563萬張。

  為何仍「一票難求」?

  增開列車調整運行解決供需矛盾

  昨日,記者詢問12306相關負責人,對於此前媒體報導的「記者買不到票,而黃牛仍然能買到票」的事情,相關負責人表示,圖形驗證碼在一定程度上阻止了黃牛搶票、囤票,但黃牛可能利用更大的帶寬、更快的網速專業從事搶票。

  「一些第三方平臺和軟體還利用未註冊的實名旅客信息進行搶票、囤票,鐵路部門將對此事採取相關措施。」黃欣也提示旅客,不要使用這些平臺買票,以免個人信息洩露。

  朱建生表示,後臺仍然從技術上監測到一些試圖破譯12306圖形驗證碼的情況,未來不排除對驗證碼系統進行再次改進升級。

  鐵路部門介紹,提高鐵路運力是最終化解供需矛盾的重要方向。今年春運,鐵路部門每天開行旅客列車3488對,比2015年春運增長14.5%。其中,圖定旅客列車3048對,春運增開旅客列車440對。

  「12月16日增開的列車投入後,以及一些運行圖調整,再加上一定的退票,現在沒買到票的旅客到時還會有票。」朱建生說。

  A12-A13版採寫/新京報記者 林斐然 吳為 楊鋒 實習生 王丹

  A12-A13版攝影/新京報記者 盧淑嬋

相關焦點

  • 12306網站驗證碼遭拍磚 「驗證碼」本意是安全不是麻煩
    近日,購票網站12306再次被拋向輿論的風口浪尖。這一次,其飽受詬病的不是令人崩潰的網站,而是驗證碼。一方面人們紛紛吐槽12306網站的圖形驗證碼不易辨認,另一方面,人們也開始對驗證碼本身產生了質疑,究竟驗證碼有沒有存在的必要,是不是有些多此一舉呢?
  • 要選對12306購票圖形驗證碼 比高考還難
    近日就有不少網友吐槽,這些五花八門的火車票圖形驗證碼讓人大傷腦筋:圖片小且像素低,讓人很難看清楚。原來,為了防止搶票軟體的幹擾,今年3月16日,12306網站進行了再次升級,用戶登錄帳號,需要從8幅彩圖中選出符合要求的圖片。而本周已進入節前搶票高峰期,要想成功「秒殺」到一張春運火車票,靠的不僅是網速,還有眼力,成功率比高考還低。
  • 12306圖形驗證碼讓人"吐槽" 驗證碼到底有什麼用
    在年底的網絡購票高峰中,中國鐵路客戶服務中心的12306圖形驗證碼系統被很多購票者「吐槽」。人們不禁要問,複雜的驗證碼系統,到底有什麼用?其實,驗證碼存在的最大意義,就是區分在頁面上進行輸入操作的是人還是自動化的軟體。
  • 圖形驗證碼難防黃牛 今年網購車票超8成無驗證碼
    中國鐵路總公司表示,今年春運網絡購票需要驗證碼的比例將被壓縮到15%以下。昨天,老牌搶票軟體360瀏覽器表示通過大數據分析,今年春運搶票初期,12306的圖形驗證碼並沒有比去年增加難度,他們發現圖形驗證碼已經不是鐵路防止黃牛倒票的主要技術手段,鐵路正在通過更加嚴格的實名認證等其他方式來防黃牛,提高了用戶的購票體驗。
  • 12306驗證碼難死學霸 鐵總:這樣才防黃牛
    日前,不少在12306網站「刷票」的網友曝圖形驗證碼「拖後腿」,大數據表明,一次就選對的成功率僅有8%,最難分別的圖形驗證碼為七星瓢蟲、經筒、噴霧器等。
  • 12306網購火車票驗證碼全靠猜 圖形碼已達581種
    橙子和橘子,章魚和魷魚,公交卡和銀行卡……最近,購買火車票成了春運前最熱的話題,為了防止搶票軟體破解,12306網站不斷將登錄的圖形驗證碼更新,層出不窮的圖形碼讓一些網購車票的旅客大傷腦筋。圖片小費眼神兒,畫質模糊霧裡看花,一旦選錯,就得刷新從來,大大降低了登錄購票的速度。
  • 12306驗證碼圖片刷不出來不顯示怎麼辦
    12306網站太不靠譜了,驗證碼半天也顯示不出來,12306驗證碼不顯示怎麼辦?不少旅客在12306網站訂票都碰見過這個問題,這個問題怎麼破呢?小編馬上為您支招。  小編分析了一下12306驗證碼不顯示的原因,主要有兩個原因。
  • 「12306奇葩驗證碼」反例背後的產品觀
    每到春運搶票時刻,吐槽12306成為每年必火的一個話題。我過去在某瀏覽器廠商做過搶票大戰的營銷,對12306這套體系算是研究過很多,順著今年奇葩驗證碼這條熱門新聞來聊一聊我的一些產品思考。三是網站服務效率低,往些年的確是12306不爭氣,流量一高網站扛不住就掛了,後來加上幾大瀏覽器廠商的圍追堵截,用伺服器來幫用戶刷票,更是給12306帶來巨大災難,當然用戶很爽。人工操作一個完整的購票查詢和下單流程可能需要20s,現在搶票軟體用程序自動化的方式1s刷一次,這樣12306伺服器承受的請求次數是之前的幾十倍。
  • 驗證之痛 12306再遭吐槽
    這次難倒他的是驗證碼輸入這個環節——每次他都按照12306提示的搶票時間打開電腦、手機,用4G、寬帶、刷票軟體緊盯餘票的數量變化並準備出手時,卻總是發現眼前的圖形驗證碼讓自己「傻傻分不清楚」,結果只能眼睜睜看著餘票不翼而飛。然而,當他選擇請黃牛來幫忙的時候,這個問題輕而易舉地解決了。為什麼12306號稱能夠狙擊黃牛的「新發明」最終刺痛的卻是小吳那顆要回家過年的心呢?
  • 復旦大學肖仰華:12306的驗證碼已不再安全,未來屬於智能驗證碼
    我們計算機領域給出的方案就是驗證碼。這個小小的驗證碼是所有人最熟悉卻又最為陌生的事物,幾乎所有人都使用過驗證碼,但是驗證碼背後的機制與原理卻並不為人所熟知。為什麼在登錄系統的時候系統會讓人輸入驗證碼?事實上就是為了做人機區分,系統需要知道是真實的人還是機器在獲取我們的數據,是真實的人在購買還是機器在刷單,是真實的人在購票還是機器在搶票。
  • 12306驗證碼已不再安全 機器準確率99.8%
    我們計算機領域給出的方案就是驗證碼。這個小小的驗證碼是所有人最熟悉卻又最為陌生的事物,幾乎所有人都使用過驗證碼,但是驗證碼背後的機制與原理卻並不為人所熟知。為什麼在登錄系統的時候系統會讓人輸入驗證碼?事實上就是為了做人機區分,系統需要知道是真實的人還是機器在獲取我們的數據,是真實的人在購買還是機器在刷單,是真實的人在購票還是機器在搶票。
  • 網購火車票驗證碼被指難辨認 圖形碼已達581種
    不能確定曾經認識的蘿蔔還是那個蘿蔔  橙子和橘子,章魚和魷魚,公交卡和銀行卡……最近,購買火車票成了春運前最熱的話題,為了防止搶票軟體破解,12306網站不斷將登錄的圖形驗證碼更新  昨天,360瀏覽器宣布他們攻破了12306的圖形驗證碼,並首次公布了一組12306驗證碼大數據。數據顯示,圖形碼的數量已經多達581種,按照要輸入兩個關鍵詞的登錄規則,用戶將有機會嘗試336980道不同驗證碼題目的機會,而一次性輸入正確的僅為8%。
  • 網購火車票超八成無需驗證碼 只隨機出現
    中國鐵路總公司表示,今年春運網絡購票需要驗證碼的比例將被壓縮到15%以下。昨天,老牌搶票軟體360瀏覽器表示通過大數據分析,今年春運搶票初期,12306的圖形驗證碼並沒有比去年增加難度,他們發現圖形驗證碼已經不是鐵路防止黃牛倒票的主要技術手段,鐵路正在通過更加嚴格的實名認證等其他方式來防黃牛,提高了用戶的購票體驗。
  • Python驗證碼識別:利用pytesser識別簡單圖形驗證碼
    (點擊上方公眾號,可快速關注)來源:  j_hao104my.oschina.net/jhao104/blog/647326一、探討識別圖形驗證碼可以說是做爬蟲的必修課,涉及到計算機圖形學,機器學習,機器視覺,人工智慧等等高深領域……簡單地說,計算機圖形學的主要研究內容就是研究如何在計算機中表示圖形、以及利用計算機進行圖形的計算、處理和顯示的相關原理與算法。
  • Python3網絡爬蟲課程 8.1圖形驗證碼的識別
    目前,很多網站都採取了各種各樣的反爬措施,其中之一便是使用驗證碼.隨著技術的發展,驗證碼卻來越複雜,花樣越來越多,爬蟲的工作也變得愈加複雜,本節將介紹圖形驗證碼的識別.圖形驗證碼我們首先將識別最簡單的驗證碼,圖形驗證碼.目標我們將以知網為例講解使用 OCR 技術識別圖形驗證碼.
  • mac使用python識別圖形驗證碼!
    前言首先這篇文章,主要是研究圖形驗證碼,後期會不定時拓展內容。
  • 使用Python和Tesseract來識別圖形驗證碼
    *本文原創作者:ipenox,本文屬FreeBuf原創獎勵計劃,未經許可禁止轉載各位在企業中做Web漏洞掃描或者滲透測試的朋友,可能會經常遇到需要對圖形驗證碼進行程序識別的需求。一、關於圖形驗證碼識別與tesseractOCR儘管多數圖型驗證碼只有區區幾個數字或字母,但你可能聽說了,在進行機器識別的過程中,你要收集樣本,對圖片去噪、二值化、提取字符、計算特徵,甚至還要祭出神經網絡去訓練數據進行機器學習……還沒開幹,退堂鼓早打響三遍了。
  • 路易斯·馮·安 驗證碼之父
    12306購票網站曾經因為更換了一種「超難」的圖形驗證碼而在各媒體報紙上大出風頭。大家都知道,節日期間的火車票很難買,而眾多搶票軟體更是火上澆油,令網絡購票變得更加艱難、混亂。為了攔截住那些違反公平的搶票軟體,12306網站推出了這種讓人大呼「坑爹」的驗證碼系統:系統要求想買票的用戶在一堆圖片裡找出目標物體,比如便利貼、漢堡、玉米等常見事物,雖然很多人在不習慣的情況下覺得有點難,但這對於想鑽空子的機器程序來說,更是難如上青天。驗證碼也很年輕
  • 用Python識別圖形驗證碼,實現自動登陸!
    驗證碼有圖形驗證碼、極驗滑動驗證碼、點觸驗證碼、宮格驗證碼。這回重點講講圖形驗證碼的識別。雖說圖形驗證碼最簡單,但是對於我這等新手,還是要苦學一番。首先尋找測試網站,網站選的是如雲閣小說網,小網站不怕被封。他
  • 12306預留電話不對,買不了票怎麼辦?這招教你在線更換預留號
    以前很多過年過節回家的小夥伴們應該經歷過,12306上面預留電話不是自己的無法網上購票,只能灰溜溜地拿上身份證去火車站改號,這裡面的辛酸淚就不說了。今天,中國鐵路官方指導教程來了,媽媽再也不用擔心我吃不飽……呸呸呸,大家再也不需要瓜兮兮地跑去火車站改預留電話了,只需要一部手機、一款12306APP全程在線自行更改預留電話。1.打開12306 App「我的12306」界面,點擊「手機核驗(已通過核驗)」。