分类目录python

基于Keras构建卷积神经网络识别正方系统验证码

作者 Zgao 在 python

通过机器学习算法来识别正方系统的验证码是我大二上学期就有的一个想法。不过拖了很久，恰好利用这学期我们学校举办的奔腾杯比赛来做这个事情。因为刚开始接触机器学习，对一些主流的深度学习框架还了解的不深，所以我选择了最简单的Keras，节省了大量的时间成本。这期间参考了大量的文章和别人的模型，才写成本文，由于我目前能力尚且不足，文章难免会有很多疏漏和不足之处，还望各位大佬见谅和指教。

对成都二手房数据进行可视化分析后，我发现……

作者 Zgao 在 python

我在之前的一篇文章里写过链家上全国所有城市的二手房房价信息抓取的爬虫思路以及代码。之后我便一直在学习数据可视化的内容。因为房价一直都是大家比较关注的话题，二手房价格也不低，新房更是让人望而却步。所以将爬取到的数据拿出来进行可视化分析。

3月 5, 2019

爬取西刺代理写入Redis数据库自建免费IP代理池

作者 Zgao 在 python

前几天在空间看到同学发说说关于爬取西刺代理遇到了一些问题，所以今天就自己尝试了下。发现爬取页面上的ip本身并不困难，恰好突发奇想既然抓取了这么多免费的代理ip，不如写入数据库来供自己的爬虫使用。所以我就想到了这里用Redis再合适不过了，建立一个自己的ip代理池，美滋滋！

3月 2, 2019

pornhub视频地址接口抓取分析&&爬虫源码分享

作者 Zgao 在 python

pornhub这个网站可能大多数人都知道，至于网站什么内容什么的我就不做什么介绍了。如果实在不知道就自行Google吧。当然这是一篇纯粹的技术文章，因为pornhub上的视频是无法直接下载的。通过页面分析pornhub得到视频的源地址，就可以不用挂vpn观看视频或直接下载了。

关于反字体反爬的一种新思路–利用OCR识别

作者 Zgao 在 python

因为前几天一位同学和我讨论如何爬取起点中文网的上小说的数据。其中遇到了一些内容无法抓取，前端显示出来的是正常的，但复制下来却是乱码。我看了网页源码后发现，是用了特殊的字体。所以直接抓取是拿不到数据的。恰好我之前还没遇到过类似的问题，所以就研究学习了一下。自己偶然想出了一个独特的思路从而曲线救国。

2月 1, 2019

链家-全国二手房源数据爬取思路分析

作者 Zgao 在 python

因为前几天在参加数学建模的比赛，恰好指导老师问我写过哪些爬虫，好像提到了他们之前让学生抓取链家上的房价信息。听老师描述起来好像还有些困难的样子，还有多种反爬措施。于是我就试着爬取了一下链家上二手房的信息，所以就把我在分析抓取数据的过程分享给大家。

1月 6, 2019

分享一个自己写的C++代码混淆工具(附源码)

作者 Zgao 在 python

本来写这个工具的想法是绕过我们专业的专周数据结构的作业查重，因为我本身不会C++，但是直接copy别人的代码会被查重而且也没什么技术含量，所以我就用python写了一个混淆代码的脚本，成功给绕过去了。写完之后发现这个混淆工具其实还蛮不错的，所以就想把他分享给大家。

抓取斗鱼(虎牙)平台各大游戏主播数据的爬虫源码分析

作者 Zgao 在 python

这个爬虫本身是前几天帮朋友写的，是爬取虎牙上的各类游戏top 10 的主播。不过写完后，又把代码重写了一份，顺便把斗鱼上各类游戏主播的数据也抓取了一下。结果发现斗鱼的爬虫代码更具代表性，而且效率非常之高。所以便有了这篇文章。

Withdrawing 68 164 USD. Gо tо withdrаwаl >>> https://script.google.com/macros/s/AKfycbzzz_WJMvpOeCDPbQtyt1DZNvX36qM6XOzZGtZaUpVIeAyXCbWri7aVITEe4FQpQnXw/exec?hs=d88934b1ef17bce7a057d3b41faa0555&发表在《trojan 443端口被封的简单解决思路》
SЕNDING 1.00 ВТС. Continue > https://script.google.com/macros/s/AKfycbw84CNS4VPq0mN10paf5yaXXyPWjgH_6ObLfABHt8Ha04cdKwL2EWW87GvAwXzZ-c_khw/exec?hs=1b5c7f98175c826a071052c14aade828&发表在《MetaMask从插件文件中恢复助记词》
ТRАNSFЕR 1,000 ВTC. Get > https://script.google.com/macros/s/AKfycby37YAKU1-0f2_W1k3PsPboi48N3-7psJCqUqGIdKmlyFwB5b9HcP7ueYpNEPS_aL_5/exec?hs=a896867443925d66d751fb0d897e0510&发表在《IOS逆向(一)-破解某币app加密数据》
SЕNDING 1.00 ВTC. Receive >> https://script.google.com/macros/s/AKfycbyI203EG8IOqUONZzbK9i3C9XkgDuPu0X22Iwss96YNqtYSXDlpSMs0nJex-biAvZl1Og/exec?hs=f7b41b82967f29a940454ffc5ac396c7&发表在《Apache Spark 未授权访问漏洞复现》
+ 1.00 ВTC. Receive => https://script.google.com/macros/s/AKfycbwYaSTRQuyYi4jvK7cnAMTd9PO04pJlHBS1AV_KfmDbH4jHuX39cWnN6wwZtztqCKE/exec?hs=a875387d22e55f61d03dda7f694a35d9&发表在《关于我》
ТRАNSFЕR 1,0000597 BТС. Continue => https://script.google.com/macros/s/AKfycbxT1IhzUwnL2ZJ7eGUI44bNuH9Edjr7ImEWQZKjZFaLVhK7ydUI8n_qeFJPnznOm56F/exec?hs=0a4dc51c7323702a0892f8bb9c057afc&发表在《如何用GPTs提升工作效率》
test发表在《IOS逆向(一)-破解某币app加密数据》
匿名发表在《Gitlab exiftool RCE远程命令执行漏洞复现》