功能说明

文章内容采集工具实现了无需编写任何采集规则,只要输入关键词就可以采集海量网络文章,支持各大主流网络平台+大部分自媒体平台的文章采集,支持多线程采集,采集效率高。通过采集任务,实现文章内容的采集,采集完毕后,可以在采集数据管理栏目对采集的数据进行编辑删除导出等操作

功能主界面

获取采集数据

按上图,点击”获取采集数据“按钮,可以获取已经采集的数据。获取的同时,可以选择具体的采集任务,文章发布时间,以及文章包含的关键词来过滤数据。按上图,点击左侧具体的文章标题,右侧的编辑框会显示某个文章的具体内容,在编辑框对文章内容可进行修改,然后点下面的”保存文章内容“可修改保存的文章内容。

数据导出

本功能实现对数据列表显示的文章标题内容等导出到本地文件。
  • 合并到一个txt
    默认此项选中,点击导出后将列表里的数据(文章标题和内容)合并导出到一个txt文件,”只导出文章标题“打勾,将只合并文章标题到一个txt文件。”只导出文章内容“打勾,将只合并文章内容到一个txt文件,如果两个都不打勾,则默认导出文章标题和内容到一个txt文件。
  • 每条数据导出一个文件,文章标题为txt标题,文章内容为txt内容
    选中此项,点击导出按钮,导出完成后列表里的每个数据都将导出生成一个txt文件,其中文章标题为txt标题,文章内容为txt内容。
  • 去除文章中的html代码(只保留文字和段落)
    本项打勾,导出的文章内容将不含html代码(默认有),导出到文本文件的文章内容即为可读内容,没有附带的任何html代码。
  • 删除采集任务
    选定一个采集任务,点此删除该任务。
  • 刷新任务列表
    点击此按钮刷新采集任务列表。