用来检测某网页依赖哪些其他域名下的资源(比如 js 和 css),支持批量操作。具体使用见 python DeSpy.py help。
这个脚本只处理了网站主页,没有对子页面做爬虫处理,因为我觉得基本上一个网站各个页面使用的第三方资源应该是一样的。以及,所有的 ajax 请求都被忽略了,处理这个需要调用浏览器内核,太麻烦。