「HTML?實體解析器」 是一種特殊的解析器,它將 HTML 代碼作為輸入,并用字符本身替換掉所有這些特殊的字符實體。
HTML 里這些特殊字符和它們對應的字符實體包括:
- 雙引號:字符實體為?
"
?,對應的字符是?"
?。 - 單引號:字符實體為?
'
?,對應的字符是?'
?。 - 與符號:字符實體為?
&
?,對應對的字符是?&
?。 - 大于號:字符實體為?
>
?,對應的字符是?>
?。 - 小于號:字符實體為?
<
?,對應的字符是?<
?。 - 斜線號:字符實體為?
⁄
?,對應的字符是?/
?。
給你輸入字符串?text
?,請你實現一個 HTML?實體解析器,返回解析器解析后的結果。
示例 1:
輸入:text = "& is an HTML entity but &ambassador; is not." 輸出:"& is an HTML entity but &ambassador; is not." 解釋:解析器把字符實體 & 用 & 替換
示例?2:
輸入:text = "and I quote: "..."" 輸出:"and I quote: \"...\""
示例 3:
輸入:text = "Stay home! Practice on Leetcode :)" 輸出:"Stay home! Practice on Leetcode :)"
示例 4:
輸入:text = "x > y && x < y is always false" 輸出:"x > y && x < y is always false"
示例 5:
輸入:text = "leetcode.com⁄problemset⁄all" 輸出:"leetcode.com/problemset/all"
思路一:模擬題意(哈希表替換)
c++解法
class Solution {
public:string entityParser(string s) {map<string, char> mp;mp["quot"] = '\"';mp["apos"] = '\'';mp["amp"] = '&';mp["gt"] = '>';mp["lt"] = '<';mp["frasl"] = '/';string ans = "";int i = 0, j = 0, n = s.size();while (i < n) {if (s[i] != '&') {ans += s[i];i++;j++;} else {j = i;while (j < n && s[j] != ';') ++j;string t = s.substr(i + 1, j - i - 1);if (mp.find(t) == mp.end()) {ans += s[i];++i, ++j;continue;}ans += mp[t];i = j + 1;}}return ans;}
};
分析:
本題考察對字符串的替換,可直接使用replace進行替換,也可將對應字符存入哈希表中,一旦讀取到對應字符串則將其替換為哈希表中對應字符串
總結:
利用哈希表可解決,replaceall更加直接