识别网站cms

前段时间在网上找了一个网站cms识别的api接口,就琢磨着准备写个网站cms自动识别的python程序。
现在新开了自制python程序的分类,准备写一点有意思的python小程序,我现在写的程序也不是特别复杂,有一定python基础的人应该都可以看懂。
慢慢的我认为真正想做网站就必须要做到原创,有一定的自己的想法。
 

可能有朋友发现2020年1月3日这一天我的网站上上了谷歌广告,谷歌联盟也
是今天通过的,广告数量和位置上都还没有优化好,所以还是见谅一下。


 
python自制小程序代码
嗅探杨森blog时的情况

程序

杨森python程序版本 3.8.0

try:
    import requests
    import json
except:
    print(u"返回桌面,Shift+鼠标右键,在此处打开命令窗口(W),输入:pip install requests")
import zlib
import json

def whatweb(url):
    response = requests.get(url,verify=False)
    #上面的代码可以随意发挥,只要获取到response即可
    #下面的代码您无需改变,直接使用即可
    whatweb_dict = {"url":response.url,"text":response.text,"headers":dict(response.headers)}
    whatweb_dict = json.dumps(whatweb_dict)
    whatweb_dict = whatweb_dict.encode()
    whatweb_dict = zlib.compress(whatweb_dict)
    data = {"info":whatweb_dict}
    return requests.post("http://whatweb.bugscaner.com/api.go",files=data)

if __name__ == '__main__':
    print('欢迎使用杨森cms判断工具')
    
    print('欢迎访问网站www.zwq20.com获取更多工具')
    print('')
    print('经过指纹库不断累计,当前指纹库共有34313条正则,涵盖了网站搭建的完整环境,各种类型的指纹,不限于cms')
    print('')
    print('------------------------------------------')
    zwq20=input('请输入你要检测的网站(输入包含http(s)://):  ')
    request = whatweb(zwq20)
    print(u"今日识别剩余次数")
    print(request.headers["X-RateLimit-Remaining"])


    wendang=open('yang.json','w')
    wendang.write(request.text)
    wendang.close()
    open_json=open('yang.json','r')
    zd_json=json.load(open_json)
    open_json.close()
    print(zd_json)
    
    
    
    
    print('欢迎再次使用  杨森blog  www.zwq20.com')

这里在使用时要注意,一定要加http或者https,我没有做规则在这里,有想法的可以完善一下,但情至少留下一个版权信息

基本的功能我已经开发的差不多了,zd_json已经是一个字典了,只需要分析一下返回值,分类输出一下就行了,我还没有分类,直接输出字典,主要是后面字典处理起来有点麻烦。
CMS有些网站嗅探不出来,他可能就不会返回值,所以这里要设置好规则,不然有可能程序会有bug,直接报错。
如果有好玩的python程序可以分享给杨森,或者有python学习方面的问题,杨森也会尽力去帮助大家。


版权属于:杨森

本文链接:http://www.zwq20.com/archives/66/

文章全部作者原创,转载时须注明出处及本声明

最后修改:2020 年 01 月 03 日 09 : 17 PM
如果觉得我的文章对你有用,请随意赞赏