数据集成平台提供了图形化的采集任务设计支持,可监控的调度任务管理功能,助企业整合异构系统数据源,构建以数据为服务的数据中心。
平台提供了强大的图形界面ETL流程设计器,可以大大缩短数据抽取项目的开发周期,界面友好、易于维护,通过工作流式的设计模式,满足各种场景的实现。
支持 40 多种主流数据库采集,如:Oracle、Mysql、PostgreSQL、Hadoop 等,能够实现关系型数据库到 Hadoop 之间的数据迁移。支持 30 多种数据文件格式,如:数据库、XML、TXT、Excel 等格式。支持 20 种清洗组件,能够对缺失数据处理,数据一致性处理,重复数据处理,逻辑错误处理,数据比对做到灵活的配置。
以调度任务的方式包装设计器所编排的ETL作业,可以定时定期地执行ETL过程流。收集执行过程中的日志信息,便于监控分析数据ETL过程中的异常情况。