有些验证码看起来很容易但是没人做自动识别的原因分析
验证码之所以存在,就是为了防止机器的自动识别,当某种验证码的自动识别软件烂大街的时候,这种验证码技术也该被产品开发团队打入冷宫了,该软件存在的价值,也就只剩下编程考古了。
其实,验证码自动识别的工具并不是没有,网上有不少采用大厂的 OCR API 实现验证码自动识别的博文,用于爬取数据之类的场景,但图像识别技术的进步,也倒逼着打码技术的进步。
题主说的简单型的验证码,前景和背景容易分离、多位字符串容易切割的,传统的 SVM (支持向量机)就可以轻松搞定。复杂的验证码,使用这几年风光的 CNN(卷积神经网络)也能将其斩于马下,然而再强大的 CNN 也依赖于大量的标注数据。如果要做到 90% 以上的识别率(90% 对于很多使用者来说还是很渣的),可能需要数以万计的样本,和比较长的训练时间。训练成功,平台认为之前的打码方式被破解后,又会提升难度或者换一种思路,别有用心的攻击者又要重新标注数据,重新训练……投入的成本,能否产生足够的利益呢?这是他们需要考虑的问题。
深度学习能力增强的同时,现在的验证码技术也衍生出了更为丰富的方式,比如B站,已经采用了滑动拼图验证码。
以网易云为例,我们提供的云安全验证码,可对外提供4种类型的验证码,滑动拼图、图中点选、短信上行验证为常规验证体系,智能无感知验证码为独立的验证体系。
网易云常规验证体系 网易云智能无感知验证码
云安全验证码抛弃了传统字符型验证码展示-填写字符-比对答案的流程,采用验证码展示-采集用户行为-分析用户行为流程,用户只需要产生指定的行为轨迹,不需要键盘手动输入,极大优化了传统验证码用户体验不佳的问题;同时验证码后台针对用户产生的行为轨迹数据进行机器学习建模,结合访问频率、地理位置、历史记录等多个维度信息,快速、准确的返回人机判定结果。灵活采用这些打码技术,可以更为有效地防御攻击,同时保证用户体验。
网易云安全(易盾)为您提供智能验证码服务,欢迎点击免费试用。
相关阅读:
标签: 验证码, 智能验证码, 滑动验证码, 验证码接口, 网站验证码- 自动识别网页验证码VB代码
- Python+Selenium+PIL+Tesseract真正自动识别验证码进行一键登录
- PHP脚本自动识别验证码查询汽车违章
- MyEclipse中,当我们写一个类实现一个接口时,会自动生成重写该接口的方法,但是,方法的参数提示不够好,是什么原因导致的呢?该如何解决呢?
- win7 u盘无法识别原因分析及解决
- 「post中文参数问题」以及「验证码自动识别备忘」
- python爬虫之自动登录与验证码识别
- 罗马帝国开创了辉煌的人类文明,但他们的数字表示法的确有些繁琐,尤其在表示大数的时候,现在看起来简直不能忍受,所以在现代很少使用了。之所以这样,不是因为发明表示法的人的智力的问题,而是因为一个宗教的原因
- USB无法识别原因分析及解决方案
- 【原创】有关Silverlight中自动生成的类中 没有WCF层edmx模型新加入的对象 原因分析。
- Android Camera开发:扫描二维码,周期性循环自动聚焦auto focus挂掉原因分析(preview is not enabled)
- Python+Selenium+PIL+Tesseract真正自动识别验证码进行一键登录
- 12306登陆窗体验证码自动识别
- 车牌自动识别在智能交通系统中的应用及前景分析
- python人工智能写验证码自动识别demo地址
- 怎么自动识别验证码
- java整理软件--- Java OCR 图像智能字符识别技术,可识别中文,但是验证码不可以识别...已测识别中文效果很好
- 自动识别图形验证码
- python数据分析与挖掘学习笔记(7)-交通路标自动识别实战与神经网络算法
- 如何识别高级的验证码:三、常见的验证码的破解分析