一款全新的网页数据采集工具:爬山虎

2017 年 12 月 2 日
 oness

前言

现在互联网上有这么多的采集器,我们为什么要开发爬山虎呢?

原因很简单,大部分已有的软件用起来不爽,于是我们就自己开发了一个。

特性

爬山虎采集器是一款全新的网页数据采集工具。作为一款工具软件,我们:

  1. 放弃了花哨的界面,换之以快速流畅的体验。
  2. 放弃了复杂的规则配置,开发了智能的自动提取算法。
  3. 在基于浏览器的可视化操作上,同时保留了快速的 HTTP 引擎架构。

爬山虎采集器在保持了用户体验、用户低学习成本的同时,兼顾了软件的数据抓取效率。

数据采集

爬山虎采集器能够采集互联网上的绝大部分网页,比如动态网页、静态网页、单页程序、表格数据、列表数据、文章数据、搜索引擎结果、下载图片等等。

发布数据

在采集到数据后,还可以发布到 CSV、Excel、MySQL、SQLite、Access、MSSQL、以及网站 API 接口上。

当然爬山虎采集器作为一个新上场的选手,跟前辈们相比,可能会有些缺点、问题。

欢迎您下载试用,并且给我们提供宝贵的意见。(如果你懒得下载,可以看下网站首页的演示视频:)

爬山虎采集器网站

编辑器

17826 次点击
所在节点    分享创造
81 条回复
ResidualSoils
2017 年 12 月 2 日
不开源的话不会是打算用来挣钱吧?
hundan
2017 年 12 月 2 日
一楼这话听着怎么这么别扭
oh
2017 年 12 月 2 日
来发个软件用来挣钱有啥问题吗……
i730
2017 年 12 月 2 日
一楼。。。。。。
1931
2017 年 12 月 2 日
P2p 种子搜索神器宇宙超级无敌加强版
est
2017 年 12 月 2 日
bandicam 亮点。
ctsed
2017 年 12 月 2 日
@ResidualSoils 碍着你了?
dzxx36gyy
2017 年 12 月 2 日
客户端软件为啥要用导出数据条数区分不同套餐... 感觉这个一般是在线服务才这么搞吧,为啥不以导出的数据源类型以及其他售后服务来区分套餐_(:з」∠)_
oness
2017 年 12 月 2 日
@dzxx36gyy 感谢建议,我在好好想下
f2f2f
2017 年 12 月 2 日
现在一在 v2 看到爬虫我就想到了煎蛋……
gouchaoer
2017 年 12 月 2 日
面向开发者不太讨好的说
cxd44
2017 年 12 月 2 日
迫切想体验
cxd44
2017 年 12 月 2 日
价格 499 元没有优惠了吗
cxd44
2017 年 12 月 2 日
支持采集论坛帖子的附件吗?
lhx2008
2017 年 12 月 2 日
和同类软件比,比如火车头比,没什么竞争力吧。
和自己写程序比,反爬虫,复杂的 ajax 数据,登录,验证码识别这些基本做不了
oness
2017 年 12 月 2 日
@lhx2008 验证码目前还在开发,其他的都可以解决的。
正是看到火车头、八爪鱼他们的优劣势,我才自己开发了这个。
oness
2017 年 12 月 2 日
@cxd44 赶紧体检,账号名发我,给你开通个权限
yeshang
2017 年 12 月 2 日
@oness 可以帮我开通个权限吗? 账号名同 V2EX ID
oness
2017 年 12 月 2 日
@yeshang 可以
yeshang
2017 年 12 月 2 日
@oness 非常感谢. 等上班的时候使用一段时间啊.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/411413

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX