Hadoop
ORC & Parquetリーダーでパーティションプルーニングを活用可能に
– 課題:
ORCおよびParquetリーダーを使って外部表を構成する際にパーティションを指定できなかった
– ソリューション:
Hiveスタイルのパーティションプルーニング機能を構文で指定可能になった
– メリット:
パフォーマンスの向上
53
create external table t_orc
(a int, b int, c varchar(50), d date, e timestamptz, f float, g numeric(5,2))
as COPY from 'hdfs:///data/t_orc/*/*/*/*/*/*/*'
ORC(hive_partition_cols='b,c,d,e,f,g');
create external table t_parquet
(a int, b int, c varchar(50), d date, e timestamptz, f float, g numeric(5,2))
as COPY from 'hdfs:///data/t_parquet/*/*/*/*/*/*/*'
PARQUET(hive_partition_cols='b,c,d,e,f,g');