前面介绍了windows下的一款效率工具,今天介绍一款基于浏览器下的扩展插件,也是一个不错的效率工具。

Automa 是一个浏览器扩展插件,它可以自动化浏览器中的操作。它允许用户设置浏览器中的操作步骤,并自动执行。比如,你可以设置一组操作步骤,在每天早上自动打开你的电子邮件帐户,然后读取最新邮件。

除此之外,Automa 还支持模拟键盘和鼠标事件,可以自动填写表单,点击按钮等。它还提供了强大的条件判断功能,可以根据浏览器中的数据决定如何执行操作。

对于网页内需要点击或者输入的内容,还提供了一个选择器,指哪打哪,网页内你能操作的它都可以选。

其实对我来说,一款能自动化运行的浏览器插件,最大的用处就在于能批量抓取网页中需要的内容。

比如,最近在写专利的过程中,就首先需要对已公开的专利有个基本的了解,避免和已有的专利重复申报,也可以参考下已授权的优秀专利,看看他们是用了什么样的思路。

但现在免费可用的专利查询平台也越来越少,能查到的信息也越来越少,以前一直在用的个免费平台某一天开始也收费了……直到又发现一个网站,可检索可获取专利全文,虽然也有收费功能,但免费功能已经足够使用,这可太感谢了……

回到正题,这个专利检索平台因为是免费版,所以不能使用高级查询功能,基本查询出的结果虽然和关键字有点相关,但排序真的是一个乱,想要尽可能多的获取相关专利,只能不停的翻下一页。

这时候,Automa的应用点就来了,我做了一个小程序,用来收集页面内的专利信息,然后点击下一页,继续收集,重复这样的操作。程序很简单,看起来是这样的。↓

在程序运行开始后,网页便会自动地翻页,等待加载,然后继续翻页,运行完成后,可以在程序日志找到抓取到的数据。↓

点击右上角可以导出csv格式数据,然后导入Excel做进一步调整,实现个性化的检索。

↓ 下载的元数据 ↓

↓ 一点点小操作后 ↓

然后就能下载几百上千条专利,任意筛选或者排序,有合适的再去网站找全文,方便极了~

不过,网站在末尾也有声明:不支持使用网络爬虫爬取数据。但这个插件是模拟人工操作的方法去浏览网页,访问量不大,且频率很低,没有直接爬取大量数据。所以,还是要配合网站合理使用,比如可以增加个延时间隔,毕竟免费的资源,失去了可就太遗憾了。

Automa插件在Chrome和火狐等应用商店均有下载,而且支持中文界面,快去下载试用吧~

官方网站:

https://www.automa.site

Chrome应用商店:

https://chrome.google.com/webstore/detail/automa/infppggnoaenmfagbfknfkancpbljcca

Firefox应用商店:

https://addons.mozilla.org/en-US/firefox/addon/automa/



本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。



长按二维码关注 @秒懂 @getinasecond

随手 点赞和分享 鼓励我们做的更好

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。