新闻采编解决方案
摘要:这是一个网络新闻采编系统,主要用于企业机构聚集浏览感兴趣的网络频道新闻、政府机构的通知政策发布,以及经过适当的编辑、摘要后,通过网站发布或通过EMAIL等推送给客户或用户。
方案内容:
根据用户自定义的网站栏目导航配置,定期、自动、批量而精确地抽取目标网络媒体栏目中的新闻或文章,转化为结构化的记录(标题,作者,来源,分类,发布时间,采集时间,内容,相关附件图片等);同时系统还提供编辑工具,辅助进行新闻的摘取和摘要、编辑工作;采集和编辑完成的数据,保存在本地数据库,用于企业内部使用、外网发布、通过EMAIL等推送给定制的客户。
特点:采集方法的灵活性、增量采集的自动性、采集源的多样性、采集数据的准确性。
新闻定位
* 指定网址频道,或者,
* 指定机构及新闻类型,或者,
* 指定行业、地域等;
* 提供可视化的采集任务配置工具,用户可以自助的随时添加采集任务。
新闻采集
* 自动采集目标网站上的新增信息(时间间隔可设定,最小1分钟);
* 支持各种网页表现形式:静态网页、动态网页、文档型网页(Word、EXCEL、PDF等);
* 支持导航页和内容页的翻页;
* 支持采集内嵌表格;
* 支持文章的附件采集和解析(Word、EXCEL、PDF等);
* 采集解析结果的元数据自动测试;
* 采集结果的去重。
新闻编辑
* 可以对采集的新闻进行走查、筛选、编辑、修改、摘要等,入库后发布到不同的目标上。
新闻发布
* 新信息提醒功能(邮件、短信等);
* 新闻列表展现;
* 新闻筛选搜索。
方案实施:根据新闻栏目和规模,实施时间为15天到2个月。