【編譯原理實驗二】——自動機實驗：NFA轉DFA并最小化

本篇適用于ZZU的編譯原理課程實驗二——自動機實驗：NFA轉DFA并最小化，包含了實驗代碼和實驗報告的內容，讀者可根據需要參考完成自己的程序設計。
如果是ZZU的學弟學妹看到這篇，那么恭喜你，你來對地方啦！
如果需要相關文檔資料的話，我也已經上傳，免費下載：「編譯原理實驗二代碼+實驗報告（ZZU）」

不要忘了點贊👍和收藏💌支持一下哦！

源代碼

先給出實驗的源代碼

#include <iostream>
#include <fstream>
#include <vector>
#include <set>
#include <map>
#include <queue>
#include <string>
#include <sstream>
using namespace std;// NFA類定義
struct NFA {set<int> states;                    // 狀態集合set<int> alphabet;                  // 字母表map<pair<int,int>, set<int>> transitions;  // 轉移函數 F(fromState, symbol)={toStates}int start_state{};                  // 初始狀態set<int> accept_states;             // 接受狀態集合
};// DFA類定義
struct DFA {set<int> states;                    // 狀態集合set<int> alphabet;                  // 字母表map<pair<int,int>, int> transitions; // 轉移函數int start_state{};                    // 初始狀態set<int> accept_states;             // 接受狀態集合
};// 從文件讀取NFA
NFA readNFAFromFile(const string& filename) {NFA nfa;ifstream file(filename);string line;// 讀取狀態集合getline(file, line);istringstream iss(line);    // 將一行數據轉換成一個輸入流，隨后可以像處理文件或標準輸入一樣從`iss`中提取數據int state;while (iss >> state) {      // 從轉換好后的每一行輸入中，逐個讀取整數作為狀態`state`nfa.states.insert(state);}// 讀取字母表getline(file, line);iss.clear();        // 重置流狀態iss.str(line);      // 讀取新的一行作為流int symbol;         // 輸入的標志字母while (iss >> symbol) {nfa.alphabet.insert(symbol);}// 讀取轉移規則數量int trans_count;file >> trans_count;// 讀取轉移規則for (int i = 0; i < trans_count; i++) {int from_state, now_symbol;     // 當前狀態，轉換字母file >> from_state >> now_symbol; // 從文件中讀取set<int> to_states_set; // 目標狀態集合int to_state;   // 目標狀態// 讀取目標狀態，添加到到目標狀態集合while (file.get() != '\n' && file >> to_state) {to_states_set.insert(to_state);}nfa.transitions[{from_state, now_symbol}] = to_states_set; // 轉移函數 F(fromState, symbol)={toState}}// 讀取初始狀態和接受狀態file >> nfa.start_state;int accept_state;file >> accept_state;nfa.accept_states.insert(accept_state);return nfa;
}// 獲取ε-閉包集合
set<int> getEpsilonClosure(const NFA& nfa, const set<int>& states) {set<int> closure = states;// 隊列進行存儲狀態集合statesqueue<int> q;for (int state : states) {q.push(state);}while (!q.empty()) {// 從前往后彈出狀態int current = q.front();q.pop();// 對每個狀態進行判斷閉包auto it = nfa.transitions.find({current, -1}); // 查找轉換函數中的當前狀態的所有ε邊if (it != nfa.transitions.end()) {for (int next : it->second) {   // it中的元素為鍵值對類型pair，second就是獲取鍵值對的后一個值if (closure.find(next) == closure.end()) { // 未被記錄進閉包集合closure.insert(next);q.push(next);}}}}return closure;
}// 合并兩個NFA
NFA mergeNFAs(const NFA& nfa1, const NFA& nfa2) {NFA merged;// 找到最大狀態編號int max_state = 0;for (int state : nfa1.states) max_state = max(max_state, state);for (int state : nfa2.states) max_state = max(max_state, state);// 新的起始狀態int new_start = max_state + 1;merged.start_state = new_start;// 合并狀態集merged.states = nfa1.states;merged.states.insert(nfa2.states.begin(), nfa2.states.end());merged.states.insert(new_start);// 合并字母表merged.alphabet = nfa1.alphabet;merged.alphabet.insert(nfa2.alphabet.begin(), nfa2.alphabet.end());// 合并轉移函數merged.transitions = nfa1.transitions;for (const auto& trans : nfa2.transitions) {merged.transitions[trans.first] = trans.second;}// 添加從新起始狀態到原始NFA起始狀態的ε轉移merged.transitions[{new_start, -1}].insert(nfa1.start_state);merged.transitions[{new_start, -1}].insert(nfa2.start_state);// 合并接受狀態merged.accept_states = nfa1.accept_states;merged.accept_states.insert(nfa2.accept_states.begin(), nfa2.accept_states.end());return merged;
}// NFA轉換為DFA
DFA convertNFAtoDFA(const NFA& nfa) {DFA dfa;map<set<int>, int> dfa_states;  // nfa狀態集 --> dfa的一個狀態queue<set<int>> unprocessed_states;// 初始化DFAdfa.alphabet = nfa.alphabet;// 求DFA的起始狀態set<int> initial_state = getEpsilonClosure(nfa, {nfa.start_state});dfa_states[initial_state] = 0;dfa.start_state = 0;unprocessed_states.push(initial_state); // 將dfa起始狀態集加入已處理狀態隊列// 使用子集構造法構建DFAwhile (!unprocessed_states.empty()) {set<int> current_state = unprocessed_states.front();unprocessed_states.pop();int dfa_state = dfa_states[current_state];// 檢查是否為接受狀態for (int state : current_state) {if (nfa.accept_states.find(state) != nfa.accept_states.end()) {dfa.accept_states.insert(dfa_state);break;}}// 對每個輸入符號構造轉移for (int symbol : nfa.alphabet) {set<int> next_state;// 將當前狀態的多條轉移合并for (int state : current_state) {auto it = nfa.transitions.find({state, symbol});if (it != nfa.transitions.end()) {next_state.insert(it->second.begin(), it->second.end()); // 多條轉移的終點合并加入到當前狀態集合的目標狀態集合// 實現多條轉移合并為一條集合與集合之間的轉移}}// 計算ε-閉包next_state = getEpsilonClosure(nfa, next_state);if (!next_state.empty()) {// 判斷是否是新狀態if (dfa_states.find(next_state) == dfa_states.end()) {int new_state = dfa_states.size(); // 為新狀態進行編號dfa_states[next_state] = new_state;unprocessed_states.push(next_state);}dfa.transitions[{dfa_state, symbol}] = dfa_states[next_state];}}}// 設置DFA狀態集for (const auto& state : dfa_states) {dfa.states.insert(state.second);}return dfa;
}// DFA最小化
DFA minimizeDFA(const DFA& dfa) {// 初始劃分：接受狀態和非接受狀態vector<set<int>> partitions(2);map<int, int> partition_map;for (int state : dfa.states) {if (dfa.accept_states.find(state) != dfa.accept_states.end()) {partitions[0].insert(state);partition_map[state] = 0;} else {partitions[1].insert(state);partition_map[state] = 1;}}bool changed; // 標記劃分是否改變do {changed = false;vector<set<int>> new_partitions; // 新的劃分for (const auto& partition : partitions) {if (partition.size() <= 1) {new_partitions.push_back(partition);continue;}map<vector<int>, set<int>> subdivision; // 子劃分for (int state : partition) {vector<int> parts; // 劃分號for (int symbol : dfa.alphabet) {auto it = dfa.transitions.find({state, symbol});if (it != dfa.transitions.end()) {parts.push_back(partition_map[it->second]);} else {parts.push_back(-1);}}subdivision[parts].insert(state);}for (const auto& sub : subdivision) {new_partitions.push_back(sub.second);if (sub.second.size() != partition.size()) {changed = true;}}}// 發生了改變if (changed) {partitions = new_partitions;partition_map.clear();for (size_t i = 0; i < partitions.size(); i++) {for (int state : partitions[i]) {partition_map[state] = i;}}}} while (changed);// 構建最小化DFADFA min_dfa;min_dfa.alphabet = dfa.alphabet;// 映射舊狀態到新狀態map<int, int> state_map;int new_state_id = 0;for (const auto& partition : partitions) {for (int state : partition) {if (state_map.find(state) == state_map.end()) {state_map[state] = new_state_id;min_dfa.states.insert(new_state_id);if (state == dfa.start_state) {min_dfa.start_state = new_state_id;}if (dfa.accept_states.find(state) != dfa.accept_states.end()) {min_dfa.accept_states.insert(new_state_id);}new_state_id++;}}}// 構建新的轉移函數for (const auto& trans : dfa.transitions) {int from_state = state_map[trans.first.first];int symbol = trans.first.second;int to_state = state_map[trans.second];min_dfa.transitions[{from_state, symbol}] = to_state;}return min_dfa;
}// 打印DFA
void printDFA(const DFA& dfa) {cout << "DFA\n";cout << "  狀態集：{";for (auto it = dfa.states.begin(); it != dfa.states.end(); ++it) {if (it != dfa.states.begin()) cout << ",";cout << *it;}cout << "}\n";cout << "  符號表：{";for (auto it = dfa.alphabet.begin(); it != dfa.alphabet.end(); ++it) {if (it != dfa.alphabet.begin()) cout << ",";cout << *it;}cout << "}\n";cout << "  狀態轉換：\n";for (const auto& trans : dfa.transitions) {cout << "    (" << trans.first.first << "," << trans.first.second << ")->" << trans.second << "\n";}cout << "  開始狀態：" << dfa.start_state << "\n";cout << "  結束狀態集：{";for (auto it = dfa.accept_states.begin(); it != dfa.accept_states.end(); ++it) {if (it != dfa.accept_states.begin()) cout << ",";cout << *it;}cout << "}\n";
}int main() {// 從文件讀取NFANFA nfa1 = readNFAFromFile("experiment02_input1.txt");NFA nfa2 = readNFAFromFile("experiment02_input2.txt");// 合并NFANFA merged_nfa = mergeNFAs(nfa1, nfa2);// 轉換為DFADFA dfa = convertNFAtoDFA(merged_nfa);// 最小化DFADFA min_dfa = minimizeDFA(dfa);// 輸出結果printDFA(min_dfa);return 0;
}

實驗報告

接下來是實驗報告的內容，希望能幫助讀者理解詞法分析程序的設計思路，以及完成實驗報告的撰寫。

一．實驗目的

理解和掌握把問題中的實體轉換成抽象模型中數據結構的能力，設計確定有窮自動機DFA和非確定有窮自動機NFA描述的對象模型或數據結構，實現DFA和NFA的基本操作（輸入和輸出）；
掌握將多個NFA合并的方法；
掌握將NFA確定化成DFA的方法；
掌握將DFA最小化的方法。
加深對自動機的理解。

二．問題描述

需要實現的功能
(1)設計一個函數（方法），實現把兩個NFA的合并；
(2)設計一個函數（方法），實現把NFA確定化成一個DFA；
(3)設計一個函數（方法），實現把DFA最小化；
(4)輸入多個NFA：NFA描述存儲在文本文件中，文件名作為命令行參數輸入；
(5)輸出合并、最小化以后的DFA到標準輸出設備。
實現原理
2.1 NFA合并
(1)創建新的開始狀態
(2)通過ε-轉換連接到原NFA的開始狀態
(3)合并狀態集、字母表、轉移函數和接受狀態
2.2 NFA確定化
(1)使用子集構造法
(2)計算ε-閉包
(3)構造新的狀態轉移函數
2.3 DFA最小化
(1)基于等價類的劃分算法
(2)初始劃分為接受狀態和非接受狀態
(3)迭代細化狀態劃分直至穩定

三．軟件設計方法的選擇

設計方法
采用結構化設計方法,主要是考慮到了:
(1)問題本身具有清晰的數據流向和處理流程
(2)功能模塊劃分明確
(3)算法實現較為直觀
各階段創建的模型
2.1 分析階段：
(1)系統流程圖
(2)數據流圖
(3)數據字典
2.2 設計階段：
(4)模塊結構圖
(5)數據結構設計
(6)算法流程圖
開發環境
編程語言: C++11
編譯器: g++
開發工具: CLion
依賴庫: STL標準模板庫

四．分析模型

系統流程圖
描述：
開始：實驗的起始點，系統準備開始執行。
讀取NFA1與讀取NFA2：從輸入文件中讀取兩個非確定有窮自動機（NFA）的描述信息。
合并NFA：將兩個NFA進行合并，創建一個新的NFA，合并后的NFA需要合并狀態集、字母表、轉移函數等。
轉換為DFA：通過子集構造法將NFA轉換為確定性有限自動機（DFA）。
最小化DFA：對轉換后的DFA進行最小化，減少狀態數并簡化自動機結構。
輸出結果：輸出最小化后的DFA描述，顯示其狀態集、轉移函數等信息。
結束：實驗完成。

圖2.1 系統流程圖

2.數據流圖
在這里插入圖片描述

圖2.2 數據流圖

描述：
NFA描述文件：輸入文件，包含NFA的定義，如狀態集、轉移函數、字母表、起始狀態和接受狀態等。
讀取NFA：讀取輸入文件中的NFA描述并將其轉化為程序內部使用的NFA數據結構。
NFA合并：將多個NFA合并為一個新的NFA，該步驟是通過創建一個新的起始狀態并加入適當的ε轉移來實現的。
NFA轉DFA：通過子集構造法將NFA轉換成DFA。此過程涉及計算狀態的ε-閉包，并構建轉移函數。
DFA最小化：對DFA進行最小化處理，使用等價類劃分法將DFA的狀態集劃分為等價類，合并等價狀態，減少狀態數。
標準輸出：輸出最小化后的DFA的各項信息，包括狀態集、接受狀態、轉移函數。

3.數據字典
3.1 NFA結構

NFA = {states: 狀態集合alphabet: 字母表transitions: 轉移函數start_state: 初始狀態accept_states: 接受狀態集合
}

描述：
states：NFA中的狀態集合。
alphabet：NFA的輸入字母表，包含所有可能的輸入符號。
transitions：轉移函數，定義了從一個狀態出發，在特定輸入下轉移到哪些狀態（包括ε轉移）。
start_state：NFA的起始狀態，是計算開始的狀態。
accept_states：NFA的接受狀態集合，表示能接受輸入字符串的狀態。

3.2 DFA結構

DFA = {states: 狀態集合alphabet: 字母表transitions: 轉移函數start_state: 初始狀態accept_states: 接受狀態集合
}

描述：
states：DFA中的狀態集合。
alphabet：DFA的輸入字母表，通常與NFA的字母表相同。
transitions：轉移函數，定義了在每個狀態下，輸入符號如何轉移到另一個狀態。
start_state：DFA的起始狀態。
accept_states：DFA的接受狀態集合，與NFA的接受狀態集合可能不同。

五．設計模型

模塊結構圖

圖2.3 模塊結構圖

描述：
主程序：程序的核心模塊，負責協調其他模塊的工作。
文件讀取模塊：負責從文件中讀取NFA的描述，并將其轉化為NFA結構。
readNFAFromFile：實現從文件中讀取NFA信息，并構造NFA數據結構。
NFA處理模塊：負責處理NFA的操作。
mergeNFAs：合并兩個NFA，生成一個新的NFA。
getEpsilonClosure：計算NFA狀態的ε-閉包。
DFA處理模塊：負責將NFA轉換為DFA，并對DFA進行最小化。
convertNFAtoDFA：將NFA轉換為DFA，使用子集構造法。
minimizeDFA：對DFA進行最小化，減少冗余狀態。
輸出模塊：負責輸出最小化后的DFA描述。
printDFA：輸出DFA的狀態集、接受狀態、轉移函數等信息。

主要數據結構

// NFA結構體
struct NFA {set<int> states;                    set<int> alphabet;                  map<pair<int,int>, set<int>> transitions;  int start_state;                    set<int> accept_states;             
};// DFA結構體
struct DFA {set<int> states;                    set<int> alphabet;                  map<pair<int,int>, int> transitions; int start_state;                    set<int> accept_states;             
};

描述：
NFA結構體：定義了NFA的數據結構，其中包括狀態集、字母表、轉移函數、起始狀態和接受狀態集。
DFA結構體：定義了DFA的數據結構，類似于NFA，但其轉移函數是確定性的，即每個狀態對于每個輸入符號只有一個確定的轉移。

主要函數接口
（1）readNFAFromFile：從文件中讀取NFA描述，并返回構建好的NFA結構。
（2）getEpsilonClosure：計算給定狀態集的ε-閉包，返回一個新的狀態集。
（3）mergeNFAs：合并兩個NFA，返回合并后的NFA。
（4）convertNFAtoDFA：將給定的NFA轉換為DFA。
（5）minimizeDFA：對給定的DFA進行最小化處理，返回最小化后的DFA。
（6）printDFA：輸出最小化后的DFA的狀態集、轉移函數、接受狀態等。

六．主要算法描述

NFA合并算法
NFA算法描述：
尋找最大狀態編號：在合并NFA時，首先需要確定新的NFA中的狀態編號，應避免與原有NFA中的狀態編號沖突。
創建新起始狀態：為合并后的NFA創建一個新的起始狀態。
合并狀態集、字母表、轉移函數、接受狀態：將兩個NFA的狀態、字母表、轉移函數和接受狀態集合并成一個新的NFA。
添加ε轉移：通過添加適當的ε轉移連接原NFA的起始狀態。

圖2.4 NFA算法流程圖

NFA轉化DFA算法
NFA轉化DFA算法描述：
計算初始狀態ε-閉包：使用ε-閉包計算NFA初始狀態的所有可達狀態。
初始化DFA：創建一個新的DFA，并將NFA的ε-閉包作為DFA的初始狀態。
判斷未處理狀態隊列空：DFA構造過程中需要遍歷所有狀態，直到沒有狀態可處理為止。
處理所有輸入符號：對于當前狀態，遍歷所有輸入符號，計算對應的下一狀態。
更新DFA轉移函數：將狀態和符號的轉移結果添加到DFA的轉移函數中。

圖2.5 NFA轉化DFA算法流程圖

DFA最小化算法
DFA最小化算法描述：
初始劃分：最初將狀態劃分為接受狀態和非接受狀態。
需要繼續劃分：檢查當前劃分是否需要進一步細化。若有相同的轉移模式的狀態，則需要進一步劃分。
對每個劃分進行細化：將狀態按照它們的轉移特征進行細化。
更新劃分映射：更新狀態劃分的映射關系，確保最小化后的狀態集滿足等價類劃分的要求。

圖2.6 DFA最小化算法流程圖 ## 七．測試數據與測試效果

測試數據格式
輸入多個NFA：NFA描述存儲在文本文件中，文件名作為命令行參數輸入
測試數據與測試效果
（1）測試數據1

NFA1：
0 1 2 3 4 5 6 7 8 9 10
0 110
0 -1 1 7
1 -1 2 4
2  0 3
3 -1 6
4  1 5
5 -1 6
6 -1 1 7
7  0 8
8  1 9
9  1 100
10NFA2：
11 12 13 14 15 16 17 18
0 18
11 -1 12 13
12 0 14
13 1 15
14 -1 16
15 -1 16
16 0 17
17 1 1811
18

測試效果：

在這里插入圖片描述

圖2.7 測試效果1

（2）測試數據2

NFA1：
0 1 2 3 4 5 6 7 8 9 10
0 16
0 -1 1 5
1 -1 2 4
2  0 3
3 -1 4
4  1 5
5 -1 60
6NFA2：
0 1 2 3 4 5 6 7 8 9 10
0 16
0 -1 1 5
1 -1 2 4
2  0 3
3 -1 4
4  1 5
5 -1 60
6

測試效果：

在這里插入圖片描述

圖2.8 測試效果2

根據實驗效果，成功輸出合并、最小化以后的DFA到標準輸出設備。

八．實驗總結

遇到的問題及解決方法
（1）ε-閉包計算問題：
問題：初始實現時未考慮遞歸計算ε-閉包
解決：使用隊列實現廣度優先搜索，確保完整計算閉包
（2）DFA最小化過程中的等價類劃分：
問題：劃分過程中狀態映射更新不及時
解決：每次劃分后立即更新狀態映射關系
（3）內存管理問題：
問題：大規模NFA轉換時內存占用過大
解決：使用STL容器自動管理內存，避免手動內存管理
收獲與體會
深入理解了自動機理論的實際應用，掌握了復雜算法的工程實現方法，提高了數據結構和算法設計能力，學會了使用STL容器進行高效的數據處理。