爬虫

混淆JS破解-极验滑动验证

2018-08-30 656浏览 0点赞 3评论

极验滑动验证主要可分为两步: 点击按钮进行验证 拖动滑块完成拼图 这两步分别由一个纯混淆的js文件实现(fullpage.8.5.3.js和slide.7.3.7.js),极验的混淆js版本更新极快,但加密逻辑基本不变,只是改改函数...

Python

mitmproxy教程

2018-08-14 521浏览 1点赞 2评论

mitmproxy是一款类似于wireshark,fiddler的功能强大的抓包工具,它包括以下三个功能: mitmproxy HTTP和HTTPS的交互式中间人代理,带有控制台界面(windows不支持mitmproxy的控制台界面) mitm...

深度学习

Tensorflow BiLSTM+CRF处理序列标注任务

2018-08-07 578浏览 2点赞 0评论

本文以Word简历信息抽取为例子来处理序列标注问题。 传统的机器学习中,用于处理NLP任务中的序列标注问题的方法通常是隐马尔科夫模型(HMM)+ 维特比算法(Viterbi Algorithm),但随着深度学习的大热,越来越多的问题倾向于用深度学习技术来解决,而本文主要介绍的...

爬虫

爬取自定义字体数据

2018-08-02 418浏览 0点赞 0评论

用自定义字体做反爬的网站,像实习僧,58同城,天眼查,会出现像下图的情况,审查元素有些数据无法正常显示,或者是显示的与实际的不一样。本文以实习僧为例大致讲解破解流程。 遇到这种情况,打开页面源码,会发现这些数据都是&#x写法的NCR字符,属于HTML中...

随记

博客2.0正式上线

2018-08-02 185浏览 0点赞 0评论

相比上一个版本,博客2.0不仅全面升级了页面,更增加了文章点赞、评论,全站搜索等功能。本站将会经常记录一些技术难点,分享最新资讯,最后诚挚感谢木庄网络博客提供的前端模板!