kettle往中间库抽取数据跟用帆软做个填报定时任务往中间库填报数据有啥区别

kettle往中间库抽取数据   跟 用帆软做个填报定时任务往中间库填报数据有啥区别?

FineReport 张宇 发布于 2022-9-10 10:53
1min目标场景问卷 立即参与
回答问题
悬赏:3 F币 + 添加悬赏
提示:增加悬赏、完善问题、追问等操作,可使您的问题被置顶,并向所有关注者发送通知
共2回答
最佳回答
0
weibwLv7高级互助
发布于2022-9-10 14:12

Kettle是专业做ETL的,很多涉及抽取和清洗的过程都是有做优化处理的。

  • 张宇 张宇(提问者) 1000个帆软模板(用了1000个数据库表)数据集都是用复杂的sql写的,预览速度慢,想用数据仓库实现,那么在数仓中也要对应建1000张数据库表吗?
    2022-09-10 14:23 
  • weibw weibw 回复 张宇(提问者) 理论上是这样的,因为尽可能讲计算留在ETL过程中,而不是在展示时计算,只有这样在报表查看的时候才会最快
    2022-09-10 14:29 
  • 张宇 张宇(提问者) 回复 weibw 在数据仓库中建表和在源数据库建表一样吗?
    2022-09-10 14:52 
  • weibw weibw 回复 张宇(提问者) 不一样的,从正常的设计来讲,是禁止在源数据库即业务数据库中创建用于外部系统分析的报表的。因为这些报表的计算是需要占用资源的,如果你将BI分析的表建在源数据库中,在报表查询时会对业务系统造成计算压力,有可能会影响到业务系统的正产运行。而数仓一般是专为数据分析创建的数据库,所以他本身的核心功能就是报表系统的查询。所以我们更多的时候是将业务系统的数据原封不动风的抽到数仓中,这一层就是贴源层ODS。然后根据贴源层的数据进行过滤清洗,这一层叫DWD,然后再针对多张表的汇总统计叫DWM,最后以报表的最终格式呈现的叫ADS。关于数仓建模理论,你可以搜一下百度的帖子,基本上大同小异。
    2022-09-10 18:18 
最佳回答
0
CD20160914Lv8专家互助
发布于2022-9-10 11:01(编辑于 2022-9-10 11:04)

假如有100万条数据。你用填报定时填报往数据库插入去试一下(大部分都是要卡死的)。。kettle设置好以后速度快。。(kettle是专门做etl数据清洗的功能多。。帆软是填报的数据量小还行,数据量大就不行了,它的功能是前端展示。主要偏向业务使用,导出一些报表,)

  • 张宇 张宇(提问者) 这俩都跟回写功能差不多是吧
    2022-09-10 11:02 
  • CD20160914 CD20160914 回复 张宇(提问者) 数据量小。都是一样的。但是处理数据量多。而且逻辑复杂的时候用kettle吧。不要纠结了,先百度kettle的功能是什么
    2022-09-10 11:05 
  • 张宇 张宇(提问者) 回复 CD20160914 我有1000个帆软模板,1000个数据库表,要在kettle建1000个任务?在数据仓库建1000个表?字段也要一致?
    2022-09-10 11:06 
  • CD20160914 CD20160914 回复 张宇(提问者) kettle作业里面可以加N个转换。一个转换里面可以写多个不同的表。。。1000个任务多吗?我们随便一个业务模块的任务都 有2W+,,字段不一样。你先说如何插入数据。。
    2022-09-10 11:17 
  • 张宇 张宇(提问者) 回复 CD20160914 在数据仓库建1000个表?字段也要一致?和源数据库表一致?
    2022-09-10 11:35 
  • 2关注人数
  • 776浏览人数
  • 最后回答于:2022-9-10 14:12
    请选择关闭问题的原因
    确定 取消
    返回顶部