子比主题论坛、社区目前已支持发布,对接19个板块,如需对接其它板块可以定制。
高铁采集器是一款功能强大的网络数据采集软件,该软件操作简单,可获取平台版本及采集器扩展安装信息,获取任务规则列表,计划任务列表,任务采集数据信息,启动暂停停止任务,编辑删除任务及计划任务获取任务运行状况等,可以有效提高我们的工作效率。
软件功能
1、规则定制
通过收集规则的定义,您可以搜索所有网站以收集几乎任何类型的信息。
2、多任务,多线程
可以同时执行多个信息采集任务,每个任务可以使用多个线程。
3、WYSIWYG
任务收集过程的WYSIWYG,链接信息,收集信息和过程中遍历的错误信息将及时反映在软件界面中。
4、数据存储
数据采集自动保存到关系数据库,数据结构可以自动调整,软件可以根据采集规则自动创建数据库,以及表格和字段,也可以灵活保存通过库的数据转到客户现有的数据库结构。
5、断点连续挖掘
信息收集任务可以在停止后从断点继续收集,您再也不用担心您的采集任务意外中断了。
6、网站登录
支持网站cookies,支持网站直观登录,即使您需要验证网站的代码也可以收集。
7、计划任务
此功能允许计划,量化或循环收集任务。
8、收集范围限制
收集范围可以根据收集的深度和网站地址的标识进行限制。
9、文件下载
可以将收集的二进制文件(如:图片,音乐,软件,文档等)收集到本地磁盘或收集结果数据库中。
10、结果替换
您可以使用您定义的规则替换集合的结果。
11、条件保存
可以根据某种条件来确定保存哪些信息,并对这些信息进行过滤。
12、过滤重复内容
软件可以根据用户设置和实际情况自动删除重复内容和重复URL的重复内容。
13、特殊链接标识
使用此功能可以识别使用JavaScript动态生成的链接或其他更奇怪的连接。
软件亮点
1、几乎所有网页都能采集
无论什么语言,无论什么编码。
2、速度是普通采集器的7倍
采用顶级系统配置,反复优化性能,让采集速度快到飞起来。
3、和复制/粘贴一样准确
采集发布如同复制粘贴一样精准,用户要的全都是精髓,怎能有遗漏。
4、网页采集的得力助手
十年磨一剑,领先各大同类软件,成就网页采集的梦想。
暂无评论内容