1、sqlparser
http://www.sqlparser.com/
優點:支持的數據庫最多,除了傳統數據庫外還支持hive和greenplum一類比較新的數據庫,調用比較方便,功能不錯
缺點:收費,500$起
2、Apache Calcite
一個構建JDBC或者ODBC訪問數據庫的框架,通過自定義一些adapter通過sql訪問任意類型的數據
優點:開源
缺點:sql解析只是一小部分功能,且只支持通用的文法樹,無法對不同數據庫提供本地化支持
3、druid
阿里的一個開源項目,其實是個JDBC,但是可以通過這個JDBC統計通過它提交的各種sql執行情況等信息,對提交sql進行監控統計
我們用到的SQL-Parser是它的一個組件:
支持數據庫不算少:
db2
mysql
odps
oracle
phoenix
postgresql
sqlserver
transact
不過部分語法支持還處于開發中,比如,不支持解析postgresql的begin/commit語法,不支持group by 1, 2這種指定字段的語法。。。-_||
編譯:
一開始懶得安裝maven使用javac編譯,結果出了一堆代碼中包含的中文編碼問題,花時間研究編碼不如乖乖下載安裝maven……-_-
在源碼根目錄下直接執行mvn:
mvn install -Dmaven.javadoc.skip=true -Dmaven.test.skip=true
編譯后代碼目錄多出target子目錄,里面有class和代碼文件的jar包
調用很簡單
1 packageparse;2
3 importjava.util.Iterator;4 importjava.util.List;5 importjava.util.Map;6 importjava.util.Set;7
8 importcom.alibaba.druid.sql.SQLUtils;9 importcom.alibaba.druid.sql.ast.SQLStatement;10 importcom.alibaba.druid.sql.dialect.postgresql.visitor.PGSchemaStatVisitor;11 import com.alibaba.druid.stat.TableStat.*;12 import com.alibaba.druid.stat.*;
14 importcom.alibaba.druid.util.JdbcConstants;15
16
17 public classtestparse {18
19 public static voidmain(String[] args) {20
21 String sql= ""
22 + "insert into tar select * from boss_table bo, ("
23 + "select a.f1, ff from emp_table a "
24 + "inner join log_table b "
25 + "on a.f2 = b.f3"
26 + ") f "
27 + "where bo.f4 = f.f5 "
28 + "group by bo.f6 , f.f7 having count(bo.f8) > 0 "
29 + "order by bo.f9, f.f10;"
30 + "select func(f) from test1; "
31 + "";32 String dbType =JdbcConstants.POSTGRESQL;33
34 //格式化輸出
35 String result =SQLUtils.format(sql, dbType);36 System.out.println(result); //缺省大寫格式
37 List stmtList =SQLUtils.parseStatements(sql, dbType);38
39 //解析出的獨立語句的個數
40 System.out.println("size is:" +stmtList.size());41 for (int i = 0; i < stmtList.size(); i++) {42
43 SQLStatement stmt =stmtList.get(i);44
45 PGSchemaStatVisitor visitor = newPGSchemaStatVisitor();46 stmt.accept(visitor);47 Map aliasmap =visitor.getAliasMap();48 for (Iterator iterator =aliasmap.keySet().iterator(); iterator.hasNext();) {49 String key =iterator.next().toString();50 System.out.println("[ALIAS]" + key + " - " +aliasmap.get(key));51 }52 Set groupby_col =visitor.getGroupByColumns();53 //54 for (Iterator iterator =groupby_col.iterator(); iterator.hasNext();) {55 Column column =(Column) iterator.next();56 System.out.println("[GROUP]" +column.toString());57 }58 //獲取表名稱
59 System.out.println("table names:");60 Map tabmap =visitor.getTables();61 for (Iterator iterator =tabmap.keySet().iterator(); iterator.hasNext();) {62 Name name =(Name) iterator.next();63 System.out.println(name.toString() + " - " +tabmap.get(name).toString());64 }65 //System.out.println("Tables : " + visitor.getCurrentTable());66 //獲取操作方法名稱,依賴于表名稱
67 System.out.println("Manipulation : " +visitor.getTables());68 //獲取字段名稱
69 System.out.println("fields : " +visitor.getColumns());70 }71
72 }73
74 }