按字典序排列最小的等效字符串

文章目錄

- 題目
- 思路
- 解題過程
- Python代碼
- C代碼
- 復雜度

題目

給出長度相同的兩個字符串s1 和 s2 ，還有一個字符串 baseStr 。
其中 s1[i] 和 s2[i] 是一組等價字符。
舉個例子，如果 s1 = “abc” 且 s2 = “cde”，那么就有 ‘a’ == ‘c’, ‘b’ == ‘d’, ‘c’ == ‘e’。
等價字符遵循任何等價關系的一般規則：

自反性：‘a’ == ‘a’
對稱性：‘a’ == ‘b’ 則必定有 ‘b’ == ‘a’
傳遞性：‘a’ == ‘b’ 且 ‘b’ == ‘c’ 就表明 ‘a’ == ‘c’

例如， s1 = “abc” 和 s2 = “cde” 的等價信息和之前的例子一樣，那么 baseStr = “eed” , “acd” 或 “aab”，這三個字符串都是等價的，而 “aab” 是 baseStr 的按字典序最小的等價字符串

利用 s1 和 s2 的等價信息，找出并返回 baseStr 的按字典序排列最小的等價字符串。

示例 1：
輸入：s1 = "parker", s2 = "morris", baseStr = "parser"
輸出："makkek"
解釋：根據 A 和 B 中的等價信息，我們可以將這些字符分為 [m,p], [a,o], [k,r,s], [e,i] 共 4 組。每組中的字符都是等價的，并按字典序排列。所以答案是 "makkek"。示例 2：
輸入：s1 = "hello", s2 = "world", baseStr = "hold"
輸出："hdld"
解釋：根據 A 和 B 中的等價信息，我們可以將這些字符分為 [h,w], [d,e,o], [l,r] 共 3 組。所以只有 S 中的第二個字符 'o' 變成 'd'，最后答案為 "hdld"。示例 3：
輸入：s1 = "leetcode", s2 = "programs", baseStr = "sourcecode"
輸出："aauaaaaada"
解釋：我們可以把 A 和 B 中的等價字符分為 [a,o,e,r,s,c], [l,p], [g,t] 和 [d,m] 共 4 組，因此 S 中除了 'u' 和 'd' 之外的所有字母都轉化成了 'a'，最后答案為 "aauaaaaada"。

提示：

1 <= s1.length, s2.length, baseStr <= 1000
s1.length == s2.length
字符串s1, s2, and baseStr 僅由從 ‘a’ 到 ‘z’ 的小寫英文字母組成。

思路

a == b，b == c，c == d，則a與d存在連通性，查找連通分量可以使用并查集。
注意：在合并s1[i]和s2[i]時，兩個字母的祖先字典序排列較小的作為新的公共祖先

在這里插入圖片描述

解題過程

1、初始化并查集，因為總共只有26個小寫字母，所以并查集長度為26，每個字母的祖先初始化為其本身。
2、關聯s1與s2中的字母。
3、關聯后再次更新并查集，確保每個字母的祖先最小。
4、遍歷baseStr，生成結果。

Python代碼

def search(node, parent):# 查找祖先節點if node == parent[node]:return nodeparent[node] = search(parent[node], parent)return parent[node]def union(node1, node2, parent):# 關聯node1、node2ancestor1 = search(node1, parent)ancestor2 = search(node2, parent)if ancestor1 < ancestor2:parent[ancestor2] = ancestor1else:parent[ancestor1] = ancestor2class Solution:def smallestEquivalentString(self, s1: str, s2: str, baseStr: str) -> str:# 初始化并查集，所有字符(字母)的父節點都是本身parent = list(range(26))# 關聯s1和s2中的每個字母n = len(s1)for i in range(n):a = ord(s1[i]) - ord("a")b = ord(s2[i]) - ord("a")union(a, b, parent)# 更新并查集for i in range(26):search(i, parent)# 生成結果ans = ""for c in baseStr:ans += chr(ord("a") + parent[ord(c) - ord("a")])return ans

C代碼

typedef struct {int* parent;
} UnionFind;UnionFind* createUnionFind(int n) {// 初始化并查集UnionFind* uf = malloc(sizeof(UnionFind));uf->parent = malloc(n * sizeof(int));for (int i = 0; i < n; i++) {uf->parent[i] = i;}return uf;
}int find(int x, UnionFind* uf) {// 查找祖先節點if (uf->parent[x] != x) {uf->parent[x] = find(uf->parent[x], uf);}return uf->parent[x];
}void unite(int x, int y, UnionFind* uf) {x = find(x, uf);y = find(y, uf);if (x == y) return;if (x > y) {uf->parent[x] = y;} else {uf->parent[y] = x;}}char* smallestEquivalentString(char* s1, char* s2, char* baseStr) {// 初始化并查集UnionFind* uf = createUnionFind(26);for (int i = 0; s1[i]; i++) {unite(s1[i] - 'a', s2[i] - 'a', uf);}for (int i = 0; baseStr[i]; i++) {baseStr[i] = 'a' + find(baseStr[i] - 'a', uf);}free(uf->parent);free(uf);return baseStr;
}

復雜度

時間復雜度：O((n+m)logC)。其中n是s1和s2的長度，m是baseStr的長度，C是字符集大小，本題中為 26。由于并查集使用了路徑壓縮優化，合并和查找的平均時間復雜度為 O(α( C ))，其中 α 是反阿克曼函數，最差時間復雜度為 O(logC)。
空間復雜度：O( C )，C 是字符集大小，本題中為 26，并查集所需的空間是 O( C )。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/908491.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/908491.shtml
英文地址，請注明出處：http://en.pswp.cn/news/908491.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！