Impala Parquet相關代碼
https://github.com/cloudera/Impala/search?l=cpp&q=parquet&ref=cmdform
沒有可重用的庫接口,需要在代碼里去看,提取出來,直接使用源碼。
調用關系如下(自右向左調用):
HdfsParquetTableWriter(HdfsTableWriter)<-HdfsTableSink<-DataSink<-PlanFragmentExecutor<-ImpalaServer::FragmentExecState
<-ImpalaServer::ExecPlanFragment<-Impala-main
Coordinator::EcecRemoteFragment<-Coordinator::Exec
hdfs-table-writer.h
寫文件步驟(具體詳見文件說明):
1. Init()
2. InitNewFile()
3. AppendRowBatch()
4. Finalize()
某些類,結構定義在源碼中找不到,需要先編譯源碼,
編譯成功后在./