hive
-
hive是基于hadoop的一个数据仓库工具(hive使用hadoop的分布式文件系统作为存储引擎)
一、使用Insert...Values语句写入数据之前主要使用的是关系数据库,那么写入数据最先想到的就是Insert语句了,在Hive中也可以使用Insert语句来写入数据。假设需要向usr表中写入5条数据,可以执行下面的步骤。获取更...
-
hive存储格式和压缩格式(hive的压缩格式)
hive表的存储格式有 TEXTFILE SEQUENCEFILE (三种压缩选择:NONE, RECORD, BLOCK。 Record压缩率低,一般建议使用BLOCK压缩) RCFILE ORC 自定义格式 hive表存储格式是表自身的存储结构,内部涉及存储数据的结构,...
-
etl常见的调度工具(Etl调度)
1.区别ETL作业调度工具和任务流调度工具kettle是一个ETL工具,ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)。kettle中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后...