Goonie信息采集系统采用领先的信息采集技术,能够自动智能化完成指定信息的采集、分类和发布等一系列信息处理过程,让这些分散在互联网上各个角落的数以亿计的海量信息为我所用。
同时Goonie信息采集系统具有丰富的接口,可以为网站、多种软件系统提供强大的信息处理应用,提高系统的应用价值。
应用领域
党、政、军应用
实时跟踪、采集与业务工作相关的信息来源。
全面满足内部工作人员对互联网信息的阅读需求。
及时解决政务外网、政务内网的信息源问题,实现动态发布。
快速解决主网站对各地级子网站的信息获取需求。
全面整合信息,实现内部跨地区、跨部门信息资源共享与有效沟通。
节约信息采集的人力、物力、时间,提高办公效率。
企业应用
实时准确地监控、追踪竞争对手动态,是企业获取竞争情报的利器。
及时获取竞争对手的公开信息以便研究同行业的发展与市场需求。
为企业决策部门和管理层提供便捷、多途径的企业战略决策工具。
大幅度地提高企业获取、利用情报的效率,节省情报信息收集、存储、挖掘的相关费用,是提高企业核心竞争力的关键。
提高企业整体分析研究能力、市场快速反应能力,建立起以知识管理为核心的“竞争情报数据仓库”,是提高企业核心竞争力的神经中枢。
新闻媒体行业应用
快速准确地自动跟踪、采集数千家网络媒体信息,扩大新闻线索,提高采编速度。
支持每天对百万条新闻进行有效抓取。监控范围的深度、频率可以自行设定。
支持对所需内容智能抽取、关键词的自动提取。
实现互联网信息内容采集、浏览、编辑、管理、发布的一体化。
产品架构
Goonie信息采集系统由数据采集、数据存储、数据管理发布三部分组成。
采集服务器实现对目标网站的信息进行实时监控,并把最新的网页及时采集到本地,进行内容分析和过滤等操作;数据库服务器提供采集信息的存储服务;Web发布模块实现网页信息的统一发布,导航和检索功能。
产品功能
监控和采集
自定义URL来源及采集频率
用户可以设定采集的栏目、URL、更新时间、扫描间隔等,系统的扫描间隔最小可以设置成1分钟,即每隔一分钟,系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化,并以最快的速度采集到本地。
支持多种网页格式
可以采集常见的静态网页(HTML/HTM/SHTML)和动态网页(ASP/PHP/JSP),还可以采集网页中包含的图片、TXT/DOC/PPT/XLS/RTF/PDF等文档格式信息。 |