Java 日期解析與格式化:從標準格式到自然語言解析

使用 Java 搭配 Apache Commons Lang3 和 Natty 庫,實現靈活高效的日期解析與格式化。


一、背景

將不同格式的日期統一成一個格式。日期格式可能有以下幾種類型:

  • 標準格式:2024-02-2814/05/20222002年5月6日
  • 非英文月份縮寫:02 NIS 201826 AGO 2018(西班牙語)
  • 自然語言:next Mondaytwo days ago

二、依賴介紹

使用的版本是 jdk8。使用以下兩個日期解析庫:

1. Apache Commons Lang3

Apache Commons Lang3 提供了豐富的工具類,能夠嚴格地解析各種標準日期格式。

<dependency><groupId>org.apache.commons</groupId><artifactId>commons-lang3</artifactId><version>3.12.0</version>
</dependency>

2. Natty

Natty 是一個專門用于解析自然語言日期的 Java 庫,支持英文描述的各種日期表達方式。

<dependency><groupId>com.joestelmach</groupId><artifactId>natty</artifactId><version>0.13</version>
</dependency>

三、核心實現代碼

定義一個工具類,提供統一的日期解析方法:

完整代碼示例:

import org.apache.commons.lang3.time.DateUtils;
import com.joestelmach.natty.Parser;
import org.apache.log4j.Level;import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.*;/**** @title* @author shijiangyong* @date 2025/5/14 14:18**/
public class SmartDateParser {// 允許解析的日期格式private static final String[] DATE_PATTERNS = {"yyyy-MM-dd", "yyyy/M/d", "dd/MM/yyyy", "yyyy年M月d日","dd MMM yyyy", "MMM dd yyyy", "dd MM yyyy","yyyyMMdd", "yyyy.MM.dd", "yyyy年MM月dd日", "d MMM yyyy","EEE, dd MMM yyyy"};// 處理非標準月份縮寫(主要針對西班牙語、法語等)private static final Map<String, String> MONTH_CORRECTIONS = new HashMap<>();static {MONTH_CORRECTIONS.put("NIS", "APR");  // 可能是 AprilMONTH_CORRECTIONS.put("ABR", "APR");  // 西班牙語 AprilMONTH_CORRECTIONS.put("AGO", "AUG");  // 西班牙語 August}/*** 解析日期并轉換為 yyyy-M-d 格式*/public static String parseDate(String input) {if (input == null || input.trim().isEmpty()) {return "Invalid Date";}input = input.trim().replaceAll("[,,]", "");// 修正月份縮寫for (Map.Entry<String, String> entry : MONTH_CORRECTIONS.entrySet()) {if (input.contains(entry.getKey())) {input = input.toUpperCase().replace(entry.getKey(), entry.getValue());}}// 1. 明確格式優先處理for (String pattern : DATE_PATTERNS) {try {SimpleDateFormat sdf = new SimpleDateFormat(pattern, Locale.ENGLISH);// 嚴格校驗日期sdf.setLenient(false);Date date = sdf.parse(input);return formatToStandard(date);} catch (ParseException ignored) {}}// 1. 使用 Apache Commons Lang3 解析try {Date date = DateUtils.parseDateStrictly(input, Locale.ENGLISH, DATE_PATTERNS);return formatToStandard(date);} catch (ParseException ignored) {}// 2. 使用 Natty 解析 (適用于 `next Monday`, `19 AUG 2019`)try {Parser parser = new Parser();List<com.joestelmach.natty.DateGroup> groups = parser.parse(input);if (!groups.isEmpty()) {List<Date> dates = groups.get(0).getDates();if (!dates.isEmpty()) {return formatToStandard(dates.get(0));}}} catch (Exception ignored) {}return "Unrecognized: " + input;}/*** 統一轉換日期為 yyyy-MM-dd 格式*/private static String formatToStandard(Date date) {Calendar cal = Calendar.getInstance();cal.setTime(date);int year = cal.get(Calendar.YEAR);int month = cal.get(Calendar.MONTH) + 1;int day = cal.get(Calendar.DAY_OF_MONTH);return String.format("%04d-%02d-%02d", year, month, day);}public static void main(String[] args) {org.apache.log4j.Logger.getRootLogger().setLevel(Level.ERROR);List<String> testDates = Arrays.asList("02 NIS 2018", "2028-4-219", "19 AUG 2019", "2019-8-19","2002年5月6日", "2005/02/03", "03 SEP 1985", "14/05/2022","20 FEB 1991", "26 AGO 2018", "08 ABR 1975", "01 09 1988","next Monday", "yesterday", "two days ago", "2024.02.28","Wed, 19 Aug 2019");for (String dateStr : testDates) {System.out.println("輸入: " + dateStr + " → 解析: " + parseDate(dateStr));}}
}

解析結果:

輸入: 02 NIS 2018 → 解析: 2018-04-02
輸入: 2028-4-219 → 解析: 2028-04-21
輸入: 19 AUG 2019 → 解析: 2019-08-19
輸入: 2019-8-19 → 解析: 2019-08-19
輸入: 2002年5月6日 → 解析: 2002-05-06
輸入: 2005/02/03 → 解析: 2005-02-03
輸入: 03 SEP 1985 → 解析: 1985-09-03
輸入: 14/05/2022 → 解析: 2022-05-14
輸入: 20 FEB 1991 → 解析: 1991-02-20
輸入: 26 AGO 2018 → 解析: 2018-08-26
輸入: 08 ABR 1975 → 解析: 1975-04-08
輸入: 01 09 1988 → 解析: 1988-09-01
輸入: next Monday → 解析: 2025-05-19
輸入: yesterday → 解析: 2025-05-13
輸入: two days ago → 解析: 2025-05-12
輸入: 2024.02.28 → 解析: 2024-02-28
輸入: Wed, 19 Aug 2019 → 解析: 2019-08-19

要求的日期格式都正確解析了。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/80961.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/80961.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/80961.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Room持久化庫:從零到一的全面解析與實戰

簡介 在Android開發中,Room作為官方推薦的數據庫持久化庫,提供了對SQLite的抽象層,使得數據庫操作更加安全、高效且易于維護。 Room通過注解處理器和編譯時驗證,顯著降低了數據庫操作的復雜度,同時支持響應式編程模式,使開發者能夠輕松實現數據變化的實時監聽。對于企業…

MySQL(6)如何刪除數據庫和表?

在 MySQL 中刪除數據庫和表是常見的管理操作。下面將詳細介紹如何使用 SQL 語句以及圖形化工具來刪除數據庫和表。 步驟一&#xff1a;連接 MySQL 服務器 首先&#xff0c;連接到 MySQL 服務器&#xff0c;可以使用命令行工具 mysql 或圖形化工具如 MySQL Workbench。 使用命…

攜固態電池、新形態鋼殼疊片電池等產品 豪鵬科技將亮相CIBF 2025

攜固態電池、新形態鋼殼疊片電池等產品 豪鵬科技將亮相CIBF 2025 來源&#xff1a; 電池百人會-電池網 豪鵬科技&#xff08;展位號:14W001&#xff09;將攜固態電池、新形態鋼殼疊片電池及高安全性鈉離子電池等前沿技術產品亮相CIBF 2025&#xff0c;憑借多年的技術積累和產…

React學習———useEffect和useLayoutEffect

useEffect useEffect是React的一個Hook&#xff0c;用于在函數組件中處理副作用。副作用包括數據獲取、訂閱、手動DOM操作以及其他需要再渲染后執行的操作 基本用法 useEffect(() > {// 副作用邏輯return () > {// 可選的清理函數} }, [依賴數組])第一個參數&#xff…

“天神之眼”計算平臺的算力設計(預計500-1000 TOPS)

關于比亞迪“天神之眼”計算平臺的算力設計&#xff08;預計500-1000 TOPS&#xff09;&#xff0c;其技術路徑和行業意義值得深入探討。以下從實現方式、技術挑戰和行業影響三個維度展開分析&#xff1a; 1. 多芯片互聯的技術實現路徑 &#xff08;1&#xff09;芯片選型方案…

FPGA: Xilinx Kintex 7實現PCIe接口

在Xilinx Kintex-7系列FPGA上實現PCIe&#xff08;Peripheral Component Interconnect Express&#xff09;接口&#xff0c;通常使用Xilinx提供的7 Series Integrated Block for PCIe IP核&#xff0c;結合Vivado設計流程。以下是實現PCIe接口的詳細步驟和關鍵點&#xff0c;適…

ArcGIS Desktop使用入門(二)常用工具條——圖形

系列文章目錄 ArcGIS Desktop使用入門&#xff08;一&#xff09;軟件初認識 ArcGIS Desktop使用入門&#xff08;二&#xff09;常用工具條——標準工具 ArcGIS Desktop使用入門&#xff08;二&#xff09;常用工具條——編輯器 ArcGIS Desktop使用入門&#xff08;二&#x…

JT/T 808 通訊協議及數據格式解析

文章目錄 一、引言二、協議數據幀結構三、消息頭結構&#xff08;Message Header&#xff09;四、常用消息類型&#xff08;Message ID&#xff09;五、典型消息體結構解析六、數據轉義規則七、校驗碼計算方法八、終端與平臺通信流程示意&#xff08;簡要&#xff09;九、平臺接…

Rust 輸出到命令行

Rust 輸出到命令行 引言 Rust 是一門系統編程語言&#xff0c;以其高性能、內存安全、并發支持和零成本抽象等特性而聞名。在開發過程中&#xff0c;將 Rust 程序的輸出傳遞到命令行是常見的需求。本文將詳細介紹 Rust 輸出到命令行的多種方法&#xff0c;幫助讀者掌握這一技…

從字符串轉換到矩陣快速冪:解決多次轉換后的長度問題

引言 在編程競賽和算法問題中&#xff0c;我們經常會遇到需要對字符串進行多次轉換的問題。本文將介紹一個有趣的問題&#xff1a;給定一個字符串和轉換規則&#xff0c;計算經過多次轉換后字符串的長度。由于直接模擬會導致性能問題&#xff0c;我們將使用矩陣快速冪來高效解…

Vue2 elementUI 二次封裝命令式表單彈框組件

需求&#xff1a;封裝一個表單彈框組件&#xff0c;彈框和表單是兩個組件&#xff0c;表單組件以插槽的形式動態傳入彈框組件中。 外部組件使用的方式如下&#xff1a; 直接上代碼&#xff1a; MyDialog.vue 彈框組件 <template><el-dialog:titletitle:visible.syn…

React Hooks:從“這什么鬼“到“真香“的奇幻之旅

寫在前面:一個讓React老手都拍案叫絕的魔法 “等等,函數組件怎么能有狀態?!” —— 這是2018年我第一次聽說React Hooks時的反應。當時我正在用class組件寫一個復雜的表單,生命周期方法亂得像一碗意大利面。直到我看到了這段代碼: function Counter() {const [count, s…

論文閱讀筆記——雙流網絡

雙流網絡論文 視頻相比圖像包含更多信息&#xff1a;運動信息、時序信息、背景信息等等。 原先處理視頻的方法&#xff1a; CNN LSTM&#xff1a;CNN 抽取關鍵特征&#xff0c;LSTM 做時序邏輯&#xff1b;抽取視頻中關鍵 K 幀輸入 CNN 得到圖片特征&#xff0c;再輸入 LSTM&…

SpringBoot Vue MySQL酒店民宿預訂系統源碼(支付寶沙箱支付)+代碼講解視頻

&#x1f497;博主介紹&#x1f497;&#xff1a;?在職Java研發工程師、專注于程序設計、源碼分享、技術交流、專注于Java技術領域和畢業設計? 溫馨提示&#xff1a;文末有 CSDN 平臺官方提供的老師 Wechat / QQ 名片 :) Java精品實戰案例《700套》 2025最新畢業設計選題推薦…

右值引用的學習

傳統的C語法中就有引用的語法&#xff0c;而C11中新增了的右值引用語法特性&#xff0c;所以從現在開始我們之前學習的引用就叫做左值引用。無論左值引用還是右值引用&#xff0c;都是給對象取別名。 左值引用和右值引用 在講之前&#xff0c;我們先來看一下什么是左值和右值…

PHP黑白膠卷底片圖轉彩圖功能 V2025.05.15

關于底片轉彩圖 傳統照片底片是攝影過程中生成的反色圖像&#xff0c;為了欣賞照片&#xff0c;需要通過沖印過程將底片轉化為正像。而隨著數字技術的發展&#xff0c;我們現在可以使用數字工具不僅將底片轉為正像&#xff0c;還可以添加色彩&#xff0c;重現照片原本的色彩效…

【Three.js基礎學習】36.particles-morphing-shader

前言 通過著色器如何實現粒子之間動態切換 一、代碼 script.js import * as THREE from three import { OrbitControls } from three/addons/controls/OrbitControls.js import { GLTFLoader } from three/addons/loaders/GLTFLoader.js import { DRACOLoader } from three/a…

【PostgreSQL數據分析實戰:從數據清洗到可視化全流程】附錄-D. 擴展插件列表(PostGIS/PostgREST等)

&#x1f449; 點擊關注不迷路 &#x1f449; 點擊關注不迷路 &#x1f449; 點擊關注不迷路 文章大綱 附錄D. PostgreSQL擴展插件速查表一、插件分類速查表二、核心插件詳解三、安裝與配置指南四、應用場景模板五、版本兼容性說明六、維護與優化建議七、官方資源與工具八、附錄…

【Linux】馮諾依曼體系結構和操作系統的理解

目錄 馮諾依曼體系結構一個例子來深入理解 初識操作系統操作系統的作用設計操作系統的目的操作系統之上和之下分別有啥 管理的精髓&#xff0c;先描述&#xff0c;再組織 馮諾依曼體系結構 我們知道&#xff0c;計算機這個東西發明出來就是幫助人們快速解決問題的。那如果我們想…

kotlin @JvmStatic注解的作用和使用場景

1. JvmStatic 的作用 JvmStatic 是 Kotlin 提供的一個注解&#xff0c;用于在 JVM 上將伴生對象&#xff08;companion object&#xff09;中的方法或屬性暴露為 Java 靜態方法或字段。 作用對象&#xff1a;只能用在 companion object 中的函數或屬性。效果&#xff1a; 在 …