Spark jdbc寫入崖山等國產數據庫失敗問題

隨著互聯網、信息產業的大發展、以及地緣政治的變化，網絡安全風險日益增長，網絡安全關乎國家安全。因此很多的企業，開始了國產替代的腳步，從服務器芯片，操作系統，到數據庫，中間件，逐步實現信息技術自主可控，規避外部技術制裁和風險。

就數據庫而言，目前很多的國產數據庫，比如瀚高、人大金倉、崖山、南大通用、虛谷等，都可以逐步的取代Oracle、MySQL、PostgreSQL等。在大數據時代，我們通常通過Spark對數據進行計算，并直接輸出到數據庫中。但是不同的數據庫中，數據類型的定義存在著一定的差異，如果直接使用Spark jdbc導入，可能會發生異常。

1.1 Spark導入數據庫常見的導入方式如下：

# Saving data to a JDBC source
jdbcDF.write \.format("jdbc") \.option("url", "jdbc:postgresql:dbserver") \.option("dbtable", "schema.tablename") \.option("user", "username") \.option("password", "password") \.save()

1.2 部分數據類型不匹配或數據庫不支持

數據庫特性：

······崖山數據庫中，對于變長字符串，沒有TEXT這個字段類型，與之相同含義的字段類型為CLOB。

sqlType和Saprk dataType不匹配：

······Spark導入geometry類型的數據，會將其識別為StringType，但是在導入虛谷數據庫中，會導入失敗，因為Spark未能正確的將sqlType和DataType匹配

其他情況…

1.3 JdbcDialects
在spark3.5的源碼中可以看到，有這么一段代碼。</

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/904521.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/904521.shtml
英文地址，請注明出處：http://en.pswp.cn/news/904521.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！