折磨人類的驗證碼,已經攔不住人機了?

搶票的時候,突然彈出來這麼個玩意兒,你能選對嗎?

換個拼圖,你每次都能一口氣對準嗎?

就連有時候打個勾,你可能都得多試兩次。

和驗證碼鬥智鬥勇這麼多年,說實話,咱都有點麻了。

但要是我告訴你,現在上面這些驗證碼已經攔不住 AI 了,卡關的只有我們這些 100% 純人類呢?

就在前不久,江江發現,不管是點擊式,九宮格選圖,甚至隱式驗證,AI agent 居然都能過了。。。

點擊式驗證碼是最容易破防的。早在 OpenAI 的 Operator 七月剛出世的時候,就有人把它拉來對着 Cloudflare 測了一波。

讓機器人自己點擊 “ 我不是機器人 ”,評論區不少人都表示這實在有點幽默了。

還有下面這種九宮格點選,老兄自己手搓 agent,後臺直連 GPT,立刻實現像素級的識別。

管你是小餅乾還是小蛋糕,樓梯還是紅綠燈,它看得比人都清楚。

除了顯式點擊,隱式驗證也不在話下。

人只要在命令行輸入 prompt,agent 自己就能點擊每一欄、輸入具體信息、完成表格提交任務。

甚至 reCAPTCHA 最後還給了它 80% 像人的高分。

我們也親自上手試了試,用不同的 agent,測了點擊式和滑動拼圖兩種驗證碼。

事先聲明,下面所有操作從打開網頁,到完成驗證,全都是 AI 乾的,咱可一點沒上手。

結果你還真別說,點擊式的驗證碼根本攔不住它一點。

還有這種滑動拼圖,AI 對得比我更快更準,對面完全沒反應過來。

好嘛,以前網上總用人機罵人,現在看來,人機應該是對一個人類的最高讚賞。

一通操作下來,江江本來覺得這東西都快被 AI 通關了。連機都攔不住,它到底還有啥存在價值?

帶着各種疑問,我們聯繫上了國內頭部驗證碼企業,極驗的 CTO 謝強老師,從驗證碼的原理、目的、到未來方向來了一個全方位答疑解惑,發現驗證碼遠遠不是表面看起來一道題這麼簡單。

聊完以後我發現,麼的,還是人類更壞啊。

首先,這一次能不能答對題,看出來對面是人是鬼,其實並不是最重要的。長遠來看,成本,纔是一切的核心。

就比如初期 AI 模型還沒出現的時候,黑客那邊破解驗證碼,靠的是窮舉法。黑客會通過特定算法去攻擊網站界面,這個網站的所有驗證碼圖像都弄到手。

在得到這些圖像後,黑客就把這些任務外包出去,找人識別和標註。。就是我們常說的打碼工。

古早打碼工界面

折下來,黑客 10 天就能搞掉一個 30 萬張的圖庫,一分錢一張,成本能控制在四五百。

當然,驗證系統的防守也很簡單,那就是用成本壓垮黑客。

目前國內的驗證系統,圖庫基本一週一更新,最快的能到 1 小時更新一次。這個更新頻率,換天王老子來也喫不消。

這道理,在 AI 時代其實也一個樣,謝強老師告訴我們,目前生成驗證碼的成本,遠低於識別的成本。

自行車、紅綠燈這些現實派的圖片驗證碼,很多大模型基本都能攻克。

但非現實的內容,大模型基本抓瞎。比如謝強老師向我們展示了他們試驗的逆天驗證碼:把人類的情緒藏到圖片裏,用 AI 隨機生成,成本 1 毛左右,僱人工識別的話,估計成本則在每張 3 毛錢左右。

硬要用 AI 識別,成本則可能更高,這樣的圖即使收集 10000 張,新 AI 模型也未必學得明白。

可能只得從頭開始訓練個大模型,但這金錢和時間成本,不是一般黑客能負擔得起的。

而做題只是第一層,系統的第二層,是在後臺還在長期觀察你的 IP。一旦發現 IP 不乾淨,立刻升級驗證,讓過關難度超級加倍。

像是下面這個例子,如果你想看個劇,點了 20 遍賽博保安還不放你走,那肯定不是因爲題答錯了。

來源:小紅書@momo

要麼是出了 bug,要麼是你被打上了 “ 高風險用戶 ” 的標籤。

一旦被盯上,輕則每次訪問先來個 10 道題,限個流,重則直接 ban IP。雖然被誤傷的良民很冤枉,但攻擊者更沒得選,要麼乖乖做題,要麼頻繁換 IP、養 IP,這代價是真高。

至於被系統盯上的原因,也有很多種。

舉個例子,如果用戶打開驗證碼用的是一個馬甲( 比如 Chrome 瀏覽器 ),解決驗證碼用的是另一個馬甲( 比如AI,小程序,APP 掛 ),系統通過 HTTP 交流記錄一看,這對不上啊,就會觸發被動,重拳出擊了。

來源:杜克大學課程海報

所以說,就算黑客們把驗證碼攻克了一遍又一遍,其實也沒啥問題,能讓攻擊者覺得這門生意不划算,成本划不來,那麼驗證碼的存在,就是有意義的。

不過,現在這些應對手段,有時候傷敵一千,也會自損八百。

做題方面,像是謝強老師搞的這個碼,直接硬控了我一分鐘。

點擊和右上角相同圖案的選項

等到了用戶那裏,每個人有沒有時間和耐心去理解做題?反正是我,我大概率原地退出。

但要是老盯着 IP,普普通通的良民,很容易被誤傷。

比如你用的是公共 WiFi,但大夥兒最近都做了同一家公司提供的驗證碼。系統那邊看到的就是,這個 IP 頻繁發了一堆請求,到處亂逛,有點怪哦。

或者手機信號不穩定,明明是同一個設備,IP 卻和你的 3/4/5G 一起反覆橫跳,這種也很危險。

所以,謝強老師認爲,未來的驗證碼發展方向和業務數據是分不開的。

通過數據,區分良民和狼人,驗證碼就不用折磨每一個人了。

畢竟,黑客破解驗證碼要麼是爲了惡意爬蟲獲取信息,要麼就是搶票、刷票。在這樣的場景下它們都有一些共性,要數次訪問網站或軟件頁面。

像是逛淘寶,我們自己隨便瞎點,和爬蟲應爬盡爬,帶給服務器的壓力肯定是不一樣的。

如果每個系統可以獨立通過後臺數據,觀測,計算每個用戶給自己帶來的負擔,精準區分出異常用戶,就可以決定要對哪個用戶進行限制或者收費訪問,增加他的成本,從而限制攻擊,又不影響正常用戶。

總的來說,這場人機攻防戰並沒有因爲 AI 的出現而結束,只是戰場從我們熟悉的幾種驗證碼,慢慢轉移到了更復雜的行爲分析和成本博弈上。

驗證碼只是一個工具,這個起源於 1997 年的老東西,未來隨時也可能因爲 AI 的衝擊,而被替換成其它更有效,無痛的攔截模式。

但驗證碼或許會消失,人與機器的邊界識別將永遠存在。希望能早點迎接那個不用再親手證明,我是人的時代吧。

撰文:莫莫莫甜甜

編輯:江江 & 面線

美編:萱萱

圖片、資料來源:

感謝極驗謝強老師的耐心回答!

Reddit、小紅書

RoundTable

https://users.cs.duke.edu/~zzy/file/captcha_poster_nsdi15.pdf

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com