python自动化邮件管理(Python实现E-Mail收集插件实例教程)
python自动化邮件管理
Python实现E-Mail收集插件实例教程__import__函数
我们都知道import是导入模块的,但是其实import实际上是使用builtin函数import来工作的。在一些程序中,我们可以动态去调用函数,如果我们知道模块的名称(字符串)的时候,我们可以很方便的使用动态调用
|
def getfunctionbyname(module_name, function_name): module = __import__ (module_name) return getattr (module, function_name) |
通过这段代码,我们就可以简单调用一个模块的函数了
插件系统开发流程
一个插件系统运转工作,主要进行以下几个方面的操作
- 获取插件,通过对一个目录里的.py文件扫描得到
- 将插件目录加入到环境变量sys.path
- 爬虫将扫描好的 url 和网页源码传递给插件
- 插件工作,工作完毕后将主动权还给扫描器
插件系统代码
在lib/core/plugin.py中创建一个spiderplus类,实现满足我们要求的代码
|
# __author__ = 'mathor' import os import sys class spiderplus( object ): def __init__( self , plugin, disallow = []): self .dir_exploit = [] self .disallow = [ '__init__' ] self .disallow.extend(disallow) self .plugin = os.getcwd() + '/' + plugin sys.path.append(plugin) def list_plusg( self ): def filter_func( file ): if not file .endswith( '.py' ): return false for disfile in self .disallow: if disfile in file : return false return true dir_exploit = filter (filter_func, os.listdir( self .plugin) return list (dir_exploit) def work( self , url, html): for _plugin in self .list_plusg(): try : m = __import__ (_plugin.split( '.' )[ 0 ]) spider = getattr (m, 'spider' ) p = spider() s = p.run(url, html) except exception as e: print (e) |
work函数中需要传递 url,html,这个就是我们扫描器传给插件系统的,通过代码
|
spider = getattr (m, 'spider' ) p = spider() s = p.run(url, html) |
我们定义插件必须使用class spider中的run方法调用
扫描器中调用插件
我们主要用爬虫调用插件,因为插件需要传递 url 和网页源码这两个参数,所以我们在爬虫获取到这两个的地方加入插件系统代码即可
首先打开spider.py,在spider.py文件开头加上
|
from lib.core import plugin |
然后在文件的末尾加上
|
disallow = [ 'sqlcheck' ] _plugin = plugin.spiderplus( 'script' , disallow) _plugin.work(_str[ 'url' ], _str[ 'html' ]) |
disallow是不允许的插件列表,为了方便测试,我们可以把 sqlcheck 填上
sql 注入融入插件系统
其实非常简单,只需要修改script/sqlcheck.py为下面即可
关于download模块,其实就是downloader模块,把downloader.py复制一份命名为download.py就行
|
import re, random from lib.core import download class spider: def run( self , url, html): if ( not url.find( "?" )): # pseudo-static page return false; downloader = download.downloader() boolean_tests = ( " and %d=%d" , " or not (%d=%d)" ) dbms_errors = { # regular expressions used for dbms recognition based on error message response "mysql" : (r "sql syntax.*mysql" , r "warning.*mysql_.*" , r "valid mysql result" , r "mysqlclient\." ), "postgresql" : (r "postgresql.*error" , r "warning.*\wpg_.*" , r "valid postgresql result" , r "npgsql\." ), "microsoft sql server" : (r "driver.* sql[\-\_\ ]*server" , r "ole db.* sql server" , r "(\w|\a)sql server.*driver" , r "warning.*mssql_.*" , r "(\w|\a)sql server.*[0-9a-fa-f]{8}" , r "(?s)exception.*\wsystem\.data\.sqlclient\." , r "(?s)exception.*\wroadhouse\.cms\." ), "microsoft access" : (r "microsoft access driver" , r "jet database engine" , r "access database engine" ), "oracle" : (r "\bora-[0-9][0-9][0-9][0-9]" , r "oracle error" , r "oracle.*driver" , r "warning.*\woci_.*" , r "warning.*\wora_.*" ), "ibm db2" : (r "cli driver.*db2" , r "db2 sql error" , r "\bdb2_\w+\(" ), "sqlite" : (r "sqlite/jdbcdriver" , r "sqlite.exception" , r "system.data.sqlite.sqliteexception" , r "warning.*sqlite_.*" , r "warning.*sqlite3::" , r "\[sqlite_error\]" ), "sybase" : (r "(?i)warning.*sybase.*" , r "sybase message" , r "sybase.*server message.*" ), } _url = url + "%29%28%22%27" _content = downloader.get(_url) for (dbms, regex) in ((dbms, regex) for dbms in dbms_errors for regex in dbms_errors[dbms]): if (re.search(regex,_content)): return true content = {} content[ 'origin' ] = downloader.get(_url) for test_payload in boolean_tests: # right page randint = random.randint( 1 , 255 ) _url = url + test_payload % (randint, randint) content[ "true" ] = downloader.get(_url) _url = url + test_payload % (randint, randint + 1 ) content[ "false" ] = downloader.get(_url) if content[ "origin" ] = = content[ "true" ] ! = content[ "false" ]: return "sql found: %" % url |
e-mail 搜索插件
最后一个简单的例子,搜索网页中的 e-mail,因为插件系统会传递网页源码,我们用一个正则表达式([\w-]+@[\w-]+\.[\w-]+)+搜索出所有的邮件。创建script/email_check.py文件
# __author__ = 'mathor'
|
import re class spider(): def run( self , url, html): #print(html) pattern = re. compile (r '([\w-]+@[\w-]+\.[\w-]+)+' ) email_list = re.findall(pattern, html) if (email_list): print (email_list) return true return false |
运行python w8ay.py
可以看到网页中的邮箱都被采集到了
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对开心学习网的支持。
原文链接:https://www.wmathor.com/index.php/archives/1193/
- jquery隐藏动画教程(jquery插件实现鼠标隐藏)
- dedecms采集插件(dedecms 软件下载模块加入flashget快车下载代码)
- idea连接不上docker(IDEA使用Docker插件远程部署项目到云服务器的方法步骤)
- Visual studio中使用VSCommands插件在大括号尾部显示方法或过程名字
- html5菜单栏(html5写一个BUI折叠菜单插件的实现方法)
- thinkphp5.1插件实现(Thinkphp5.0框架使用模型Model的获取器、修改器、软删除数据操作示例)
- jquery插件开发
- smartbattery插件正确使用方法(Smarty模板配置实例简析)
- dedecms添加模板(dedecms正文自动排版插件 伪原创站必备)
- dedecms缩略图插件(织梦DEDECMS有缩略图显示,没有显示随机指定图片的实现方法)
- python自动化邮件管理(Python实现E-Mail收集插件实例教程)
- dedecms导入doc插件(DEDECMS教程之静态模板类类文件)
- html5 canvas 性能(基于html5 canvas做批改作业的小插件)
- dede收录查询插件(dede:likearticle文章标签和tag标签关联错误解决方法)
- thinkphp支付宝支付(thinkPHP和onethink微信支付插件分享)
- docker socket文件丢失(解决vscode docker插件docker.socket权限问题)
- 这支 奇兵队 腕大 有范儿还各怀绝技,毒贩杀人犯见了都要仓皇而逃(这支奇兵队腕大)
- 雄藩崛起 奇兵队与幕末长州藩军事改革(雄藩崛起奇兵队与幕末长州藩军事改革)
- 九月初,爱如蜜糖,甜到心扉,迷恋彼此,一日不见兮,思之若狂(九月初爱如蜜糖)
- ()
- 对你思念入骨的女人,跟你见面时会有这几种表现,藏都藏不住(对你思念入骨的女人)
- 纳兰性德绝美作,一场重逢,成就最后一首称得上惊艳的《如梦令》(纳兰性德绝美作)
热门推荐
- ecs设置(如何解决ECS Windows提示显示设置无法从远程会话进行更改)
- dedecms获取子目录(详解dedecms利用[field:arcurl/]无法获取文章路径的解决方法)
- mysql修改初始密码教程(使用MySQL命令行修改密码)
- dedecms授权查询(解析dedeCMS验证码的实现代码)
- knn算法详细步骤(Python实现KNNK-近邻算法的示例代码)
- mysql的分页原理(mysql分页的limit参数简单示例)
- pycharm如何自定义模板(对Pycharm创建py文件时自定义头部模板的方法详解)
- 网页打开serviceunavailable(503 service unavailable错误解决方案讲解)
- 公有云私有云混合云对比(公有云和私有云的区别 如何搭建云存储)
- docker 命令上传镜像到镜像仓库(Docker 使用国内镜像仓库的方法)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9