python和nltk自然語言處理書評_Python和NLTK自然語言處理

模塊1 NLTK基礎知識

第 1章 自然語言處理簡介 3

1.1 為什么要學習NLP 4

1.2 從Python的基本知識開始 7

1.2.1 列表 7

1.2.2 自助 8

1.2.3 正則表達式 9

1.2.4 詞典 11

1.2.5 編寫函數 11

1.3 NLTK 13

1.4 試一試 18

1.5 本章小結 18

第 2章 文本的整理和清洗 19

2.1 文本整理 19

2.2 文本清洗 21

2.3 句子拆分器 22

2.4 標記解析 22

2.5 詞干提取 24

2.6 詞形還原 25

2.7 停用詞刪除 26

2.8 生僻字刪除 27

2.9 拼寫校正 27

2.10 試一試 28

2.11 本章小結 28

第3章 詞性標注 30

3.1 什么是詞性標注 30

3.1.1 斯坦福標注器 33

3.1.2 深入了解標注器 34

3.1.3 序列標注器 35

3.1.4 布里爾標注器 37

3.1.5 基于標注器的機器學習 37

3.2 命名實體識別 38

3.3 試一試 40

3.4 本章小結 41

第4章 對文本的結構進行語法分析 42

4.1 淺層語法分析與深層語法

分析 42

4.2 語法分析的兩種方法 43

4.3 為什么需要語法分析 43

4.4 不同類型的語法分析器 45

4.4.1 遞歸下降的語法分析器 45

4.4.2 移位歸約語法分析器 45

4.4.3 圖表語法分析器 45

4.4.4 正則表達式語法

分析器 46

4.5 依存分析 47

4.6 組塊化 49

4.7 信息抽取 51

4.7.1 命名實體識別 52

4.7.2 關系抽取 52

4.8 本章小結 53

第5章 NLP應用 54

5.1 構建第 一個NLP應用 54

5.2 其他的NLP應用 58

5.2.1 機器翻譯 58

5.2.2 統計機器翻譯 59

5.2.3 信息檢索 59

5.2.4 語音識別 61

5.2.5 文本分類 62

5.2.6 信息提取 63

5.2.7 問答系統 64

5.2.8 對話系統 64

5.2.9 詞義消歧 64

5.2.10 主題建模 64

5.2.11 語言檢測 65

5.2.12 光學字符識別 65

5.3 本章小結 65

第6章 文本分類 66

6.1 機器學習 67

6.2 文本分類 68

6.3 采樣 70

6.3.1 樸素貝葉斯 73

6.3.2 決策樹 75

6.3.3 隨機梯度下降 76

6.3.4 邏輯回歸 77

6.3.5 支持向量機 78

6.4 隨機森林算法 79

6.5 文本聚類 79

6.6 文本的主題建模 81

6.7 參考資料 83

6.8 本章小結 83

第7章 網絡爬取 85

7.1 網絡爬蟲 85

7.2 編寫第 一個爬蟲程序 86

7.3 Scrapy中的數據流 89

7.3.1 Scrapy命令行界面 89

7.3.2 項 94

7.4 站點地圖蜘蛛 96

7.5 項管道 97

7.6 外部參考 98

7.7 本章小結 99

第8章 與其他Python庫一同

使用NLTK 100

8.1 NumPy 100

8.1.1 ndarray 101

8.1.2 基本操作 102

8.1.3 從數組中提取數據 103

8.1.4 復雜的矩陣運算 103

8.2 SciPy 107

8.2.1 線性代數 108

8.2.2 特征值和特征向量 108

8.2.3 稀疏矩陣 109

8.2.4 優化 110

8.3 Pandas 111

8.3.1 讀取數據 112

8.3.2 時序數據 114

8.3.3 列轉換 115

8.3.4 噪聲數據 116

8.4 Matplotlib 117

8.4.1 subplot 118

8.4.2 添加軸 119

8.4.3 散點圖 120

8.4.4 柱狀圖 120

8.4.5 3D圖 121

8.5 外部參考 121

8.6 本章小結 121

第9章 使用Python進行社交媒體

挖掘 122

9.1 數據收集 122

9.2 數據提取 126

9.3 地理可視化 128

9.3.1 影響者檢測 129

9.3.2 Facebook 130

9.3.3 影響者的朋友 134

9.4 本章小結 135

第 10章 大規模的文本挖掘 136

10.1 在Hadoop上使用Python的

不同方法 136

10.1.1 Python的流 137

10.1.2 Hive/Pig UDF 137

10.1.3 流包裝器 137

10.2 在Hadoop上運行NLTK 138

10.2.1 UDF 138

10.2.2 Python流 140

10.3 在Hadoop上運行

Scikit-learn 141

10.4 PySpark 144

10.5 本章小結 146

模塊2 使用Python 3的NLTK 3進行文本處理

第 1章 標記文本和WordNet的基礎 149

1.1 引言 149

1.2 將文本標記成句子 150

1.2.1 準備工作 150

1.2.2 工作方式 151

1.2.3 工作原理 151

1.2.4 更多信息 151

1.2.5 請參閱 152

1.3 將句子標記成單詞 152

1.3.1 工作方式 152

1.3.2 工作原理 153

1.3.3 更多信息 153

1.3.4 請參閱 154

1.4 使用正則表達式標記語句 154

1.4.1 準備工作 155

1.4.2 工作方式 155

1.4.3 工作原理 155

1.4.4 更多信息 155

1.4.5 請參閱 156

1.5 訓練語句標記生成器 156

1.5.1 準備工作 156

1.5.2 工作方式 156

1.5.3 工作原理 157

1.5.4 更多信息 158

1.5.5 請參閱 158

1.6 在已標記的語句中過濾

停用詞 158

1.6.1 準備工作 158

1.6.2 工作方式 159

1.6.3 工作原理 159

1.6.4 更多信息 159

1.6.5 請參閱 160

1.7 查找WordNet中單詞的

Synset 160

1.7.1 準備工作 160

1.7.2 工作方式 160

1.7.3 工作原理 161

1.7.4 更多信息 161

1.7.5 請參閱 163

1.8 在WordNet中查找詞元和

同義詞 163

1.8.1 工作方式 163

1.8.2 工作原理 163

1.8.3 更多信息 163

1.8.4 請參閱 165

1.9 計算WordNet和Synset的

相似度 165

1.9.1 工作方式 165

1.9.2 工作原理 165

1.9.3 更多信息 166

1.9.4 請參閱 167

1.10 發現單詞搭配 167

1.10.1 準備工作 167

1.10.2 工作方式 167

1.10.3 工作原理 168

1.10.4 更多信息 168

1.10.5 請參閱 169

第 2章 替換和校正單詞 170

2.1 引言 170

2.2 詞干提取 170

2.2.1 工作方式 171

2.2.2 工作原理 171

2.2.3 更多信息 171

2.2.4 請參閱 173

2.3 使用WordNet進行詞形還原 173

2.3.1 準備工作 173

2.3.2 工作方式 173

2.3.3 工作原理 174

2.3.4 更多信息 174

2.3.5 請參閱 175

2.4 基于匹配的正則表達式替換

單詞 175

2.4.1 準備工作 175

2.4.2 工作方式 175

2.4.3 工作原理 176

2.4.4 更多信息 177

2.4.5 請參閱 177

2.5 移除重復字符 177

2.5.1 準備工作 177

2.5.2 工作方式 178

2.5.3 工作原理 178

2.5.4 更多信息 179

2.5.5 請參閱 179

2.6 使用Enchant進行拼寫校正 180

2.6.1 準備工作 180

2.6.2 工作方式 180

2.6.3 工作原理 181

2.6.4 更多信息 181

2.6.5 請參閱 183

2.7 替換同義詞 183

2.7.1 準備工作 183

2.7.2 工作方式 183

2.7.3 工作原理 184

2.7.4 更多信息 184

2.7.5 請參閱 185

2.8 使用反義詞替換否定形式 186

2.8.1 工作方式 186

2.8.2 工作原理 187

2.8.3 更多信息 187

2.8.4 請參閱 188

第3章 創建自定義語料庫 189

3.1 引言 189

3.2 建立自定義語料庫 190

3.2.1 準備工作 190

3.2.2 工作方式 190

3.2.3 工作原理 191

3.2.4 更多信息 192

3.2.5 請參閱 192

3.3 創建詞匯表語料庫 192

3.3.1 準備工作 192

3.3.2 工作方式 193

3.3.3 工作原理 193

3.3.4 更多信息 194

3.3.5 請參閱 194

3.4 創建已標記詞性單詞的

語料庫 195

3.4.1 準備工作 195

3.4.2 工作方式 195

3.4.3 工作原理 196

3.4.4 更多信息 196

3.4.5 請參閱 199

3.5 創建已組塊短語的語料庫 199

3.5.1 準備工作 199

3.5.2 工作方式 199

3.5.3 工作原理 201

3.5.4 更多信息 201

3.5.5 請參閱 203

3.6 創建已分類文本的語料庫 203

3.6.1 準備工作 204

3.6.2 工作方式 204

3.6.3 工作原理 204

3.6.4 更多信息 205

3.6.5 請參閱 206

3.7 創建已分類組塊語料庫

讀取器 206

3.7.1 準備工作 206

3.7.2 工作方式 207

3.7.3 工作原理 208

3.7.4 更多信息 209

3.7.5 請參閱 213

3.8 懶惰語料庫加載 213

3.8.1 工作方式 213

3.8.2 工作原理 214

3.8.3 更多信息 214

3.9 創建自定義語料庫視圖 215

3.9.1 工作方式 215

3.9.2 工作原理 216

3.9.3 更多信息 217

3.9.4 請參閱 218

3.10 創建基于MongoDB的

語料庫讀取器 218

3.10.1 準備工作 219

3.10.2 工作方式 219

3.10.3 工作原理 220

3.10.4 更多信息 221

3.10.5 請參閱 221

3.11 在加鎖文件的情況下編輯

語料庫 221

3.11.1 準備工作 221

3.11.2 工作方式 221

3.11.3 工作原理 222

第4章 詞性標注 224

4.1 引言 224

4.2 默認標注 225

4.2.1 準備工作 225

4.2.2 工作方式 225

4.2.3 工作原理 226

4.2.4 更多信息 227

4.2.5 請參閱 228

4.3 訓練一元組詞性標注器 228

4.3.1 工作方式 228

4.3.2 工作原理 229

4.3.3 更多信息 230

4.3.4 請參閱 231

4.4 回退標注的組合標注器 231

4.4.1 工作方式 231

4.4.2 工作原理 232

4.4.3 更多信息 232

4.4.4 請參閱 233

4.5 訓練和組合N元標注器 233

4.5.1 準備工作 233

4.5.2 工作方式 233

4.5.3 工作原理 234

4.5.4 更多信息 235

4.5.5 請參閱 236

4.6 創建似然單詞標簽的

模型 236

4.6.1 工作方式 236

4.6.2 工作原理 237

4.6.3 更多信息 237

4.6.4 請參閱 238

4.7 使用正則表達式標注 238

4.7.1 準備工作 238

4.7.2 工作方式 238

4.7.3 工作原理 239

4.7.4 更多信息 239

4.7.5 請參閱 239

4.8 詞綴標簽 239

4.8.1 工作方式 239

4.8.2 工作原理 240

4.8.3 更多信息 240

4.8.4 請參閱 241

4.9 訓練布里爾標注器 241

4.9.1 工作方式 241

4.9.2 工作原理 242

4.9.3 更多信息 243

4.9.4 請參閱 244

4.10 訓練TnT標注器 244

4.10.1 工作方式 244

4.10.2 工作原理 244

4.10.3 更多信息 245

4.10.4 請參閱 246

4.11 使用WordNet進行

標注 246

4.11.1 準備工作 246

4.11.2 工作方式 247

4.11.3 工作原理 248

4.11.4 請參閱 248

4.12 標注專有名詞 248

4.12.1 工作方式 248

4.12.2 工作原理 249

4.12.3 請參閱 249

4.13 基于分類器的標注 249

4.13.1 工作方式 250

4.13.2 工作原理 250

4.13.3 更多信息 251

4.13.4 請參閱 252

4.14 使用NLTK訓練器訓練

標注器 253

4.14.1 工作方式 253

4.14.2 工作原理 254

4.14.3 更多信息 258

4.14.4 請參閱 260

第5章 提取組塊 261

5.1 引言 261

5.2 使用正則表達式組塊和

隔斷 262

5.2.1 準備工作 262

5.2.2 工作方式 262

5.2.3 工作原理 263

5.2.4 更多信息 265

5.2.5 請參閱 267

5.3 使用正則表達式合并和拆分

組塊 267

5.3.1 工作方式 267

5.3.2 工作原理 269

5.3.3 更多信息 270

5.3.4 請參閱 271

5.4 使用正則表達式擴展和刪除

組塊 271

5.4.1 工作方式 271

5.4.2 工作原理 272

5.4.3 更多信息 273

5.4.4 請參閱 273

5.5 使用正則表達式進行部分

解析 273

5.5.1 工作方式 273

5.5.2 工作原理 274

5.5.3 更多信息 275

5.5.4 請參閱 276

5.6 訓練基于標注器的組塊器 276

5.6.1 工作方式 276

5.6.2 工作原理 277

5.6.3 更多信息 278

5.6.4 請參閱 279

5.7 基于分類的分塊 279

5.7.1 工作方式 279

5.7.2 工作原理 282

5.7.3 更多信息 282

5.7.4 請參閱 283

5.8 提取命名實體 283

5.8.1 工作方式 283

5.8.2 工作原理 284

5.8.3 更多信息 284

5.8.4 請參閱 285

5.9 提取專有名詞組塊 285

5.9.1 工作方式 286

5.9.2 工作原理 286

5.9.3 更多信息 286

5.10 提取部位組塊 287

5.10.1 工作方式 288

5.10.2 工作原理 290

5.10.3 更多信息 290

5.10.4 請參閱 290

5.11 訓練命名實體組塊器 290

5.11.1 工作方式 290

5.11.2 工作原理 292

5.11.3 更多信息 292

5.11.4 請參閱 293

5.12 使用NLTK訓練器訓練

組塊器 293

5.12.1 工作方式 293

5.12.2 工作原理 294

5.12.3 更多信息 295

5.12.4 請參閱 299

第6章 轉換組塊與樹 300

6.1 引言 300

6.2 過濾句子中無意義的

單詞 301

6.2.1 準備工作 301

6.2.2 工作方式 301

6.2.3 工作原理 302

6.2.4 更多信息 302

6.2.5 請參閱 303

6.3 糾正動詞形式 303

6.3.1 準備工作 303

6.3.2 工作方式 303

6.3.3 工作原理 305

6.3.4 請參閱 306

6.4 交換動詞短語 306

6.4.1 工作方式 306

6.4.2 工作原理 307

6.4.3 更多信息 307

6.4.4 請參閱 307

6.5 交換名詞基數 308

6.5.1 工作方式 308

6.5.2 工作原理 309

6.5.3 請參閱 309

6.6 交換不定式短語 309

6.6.1 工作方式 309

6.6.2 工作原理 310

6.6.3 更多信息 310

6.6.4 請參閱 310

6.7 單數化復數名詞 310

6.7.1 工作方式 310

6.7.2 工作原理 311

6.7.3 請參閱 311

6.8 鏈接組塊變換 311

6.8.1 工作方式 311

6.8.2 工作原理 312

6.8.3 更多信息 312

6.8.4 請參閱 313

6.9 將組塊樹轉換為文本 313

6.9.1 工作方式 313

6.9.2 工作原理 314

6.9.3 更多信息 314

6.9.4 請參閱 314

6.10 平展深度樹 314

6.10.1 準備工作 315

6.10.2 工作方式 315

6.10.3 工作原理 316

6.10.4 更多信息 317

6.10.5 請參閱 318

6.11 創建淺樹 318

6.11.1 工作方式 318

6.11.2 工作原理 320

6.11.3 請參閱 320

6.12 轉換樹標簽 320

6.12.1 準備工作 320

6.12.2 工作方式 321

6.12.3 工作原理 322

6.12.4 請參閱 322

第7章 文本分類 323

7.1 引言 323

7.2 詞袋特征提取 324

7.2.1 工作方式 324

7.2.2 工作原理 325

7.2.3 更多信息 325

7.2.4 請參閱 327

7.3 訓練樸素貝葉斯

分類器 327

7.3.1 準備工作 327

7.3.2 工作方式 328

7.3.3 工作原理 329

7.3.4 更多信息 330

7.3.5 請參閱 333

7.4 訓練決策樹分類器 334

7.4.1 工作方式 334

7.4.2 工作原理 335

7.4.3 更多信息 335

7.4.4 請參閱 337

7.5 訓練最大熵分類器 337

7.5.1 準備工作 337

7.5.2 工作方式 337

7.5.3 工作原理 338

7.5.4 更多信息 339

7.5.5 請參閱 340

7.6 訓練scikit-learn

分類器 340

7.6.1 準備工作 341

7.6.2 工作方式 341

7.6.3 工作原理 342

7.6.4 更多信息 343

7.6.5 請參閱 345

7.7 衡量分類器的精準率和

召回率 346

7.7.1 工作方式 346

7.7.2 工作原理 347

7.7.3 更多信息 348

7.7.4 請參閱 349

7.8 計算高信息量單詞 349

7.8.1 工作方式 350

7.8.2 工作原理 351

7.8.3 更多信息 352

7.8.4 請參閱 354

7.9 使用投票組合分類器 354

7.9.1 準備工作 355

7.9.2 工作方式 355

7.9.3 工作原理 356

7.9.4 請參閱 356

7.10 使用多個二元分類器

分類 357

7.10.1 準備工作 357

7.10.2 工作方式 357

7.10.3 工作原理 361

7.10.4 更多信息 362

7.10.5 請參閱 363

7.11 使用NLTK訓練器訓練

分類器 363

7.11.1 工作方式 363

7.11.2 工作原理 364

7.11.3 更多信息 365

7.11.4 請參閱 371

第8章 分布式進程和大型數據集的

處理 372

8.1 引言 372

8.2 使用execnet進行分布式

標注 372

8.2.1 準備工作 373

8.2.2 工作方式 373

8.2.3 工作原理 374

8.2.4 更多內容 375

8.2.5 請參閱 377

8.3 使用execnet進行分布式

組塊 377

8.3.1 準備工作 377

8.3.2 工作方式 377

8.3.3 工作原理 378

8.3.4 更多內容 379

8.3.5 請參閱 379

8.4 使用execnet并行處理

列表 379

8.4.1 工作方式 379

8.4.2 工作原理 380

8.4.3 更多內容 381

8.4.4 請參閱 381

8.5 在Redis中存儲頻率分布 382

8.5.1 準備工作 382

8.5.2 工作方式 382

8.5.3 工作原理 384

8.5.4 更多內容 385

8.5.5 請參閱 386

8.6 在Redis中存儲條件頻率

分布 386

8.6.1 準備工作 386

8.6.2 工作方式 386

8.6.3 工作原理 387

8.6.4 更多內容 388

8.6.5 請參閱 388

8.7 在Redis中存儲有序

字典 388

8.7.1 準備工作 388

8.7.2 工作方式 388

8.7.3 工作原理 390

8.7.4 更多內容 391

8.7.5 請參閱 392

8.8 使用Redis和execnet進行

分布式單詞評分 392

8.8.1 準備工作 392

8.8.2 工作方式 392

8.8.3 工作原理 393

8.8.4 更多內容 396

8.8.5 請參閱 396

第9章 解析特定的數據類型 397

9.1 引言 397

9.2 使用dateutil解析日期和

時間 398

9.2.1 準備工作 398

9.2.2 工作方式 398

9.2.3 工作原理 399

9.2.4 更多信息 399

9.2.5 請參閱 399

9.3 時區的查找和轉換 400

9.3.1 準備工作 400

9.3.2 工作方式 400

9.3.3 工作原理 402

9.3.4 更多信息 402

9.3.5 請參閱 403

9.4 使用lxml從HTML中提取

URL 403

9.4.1 準備工作 403

9.4.2 工作方式 403

9.4.3 工作原理 404

9.4.4 更多信息 404

9.4.5 請參閱 405

9.5 清理和剝離HTML 405

9.5.1 準備工作 405

9.5.2 工作方式 405

9.5.3 工作原理 405

9.5.4 更多信息 406

9.5.5 請參閱 406

9.6 使用BeautifulSoup轉換

HTML實體 406

9.6.1 準備工作 406

9.6.2 工作方式 406

9.6.3 工作原理 407

9.6.4 更多信息 407

9.6.5 請參閱 407

9.7 檢測和轉換字符編碼 407

9.7.1 準備工作 408

9.7.2 工作方式 408

9.7.3 工作原理 409

9.7.4 更多信息 409

9.7.5 請參閱 410

附錄A 賓州treebank詞性標簽 411

模塊3 使用Python掌握自然語言處理

第 1章 使用字符串 417

1.1 標記化 417

1.1.1 將文本標記為句子 418

1.1.2 其他語言文字的標記化 418

1.1.3 將句子標記為單詞 419

1.1.4 使用TreebankWordTokenizer

進行標記化 420

1.1.5 使用正則表達式進行

標記化 421

1.2 規范化 424

1.2.1 消除標點符號 424

1.2.2 轉化為小寫和大寫 425

1.2.3 處理停用詞 425

1.2.4 計算英語中的停用詞 426

1.3 替代和糾正標記 427

1.3.1 使用正則表達式替換

單詞 427

1.3.2 使用一個文本替換另一個

文本的示例 428

1.3.3 在標記化之前進行

替代 428

1.3.4 處理重復的字符 428

1.3.5 刪除重復字符的示例 429

1.3.6 使用單詞的同義詞替換

單詞 430

1.4 在文本上應用齊夫定律 431

1.5 相似性量度 431

1.5.1 使用編輯距離算法應用

相似性量度 432

1.5.2 使用杰卡德系數應用

相似性量度 434

1.5.3 使用史密斯-沃特曼算法

應用相似性量度 434

1.5.4 其他字符串相似性指標 435

1.6 本章小結 436

第 2章 統計語言模型 437

2.1 單詞頻率 437

2.1.1 對給定文本進行最大

似然估計 441

2.1.2 隱馬爾可夫模型估計 448

2.2 在MLE模型上應用平滑 450

2.2.1 加一平滑法 450

2.2.2 古德-圖靈算法 451

2.2.3 聶氏估計 456

2.2.4 威滕 貝爾估計 457

2.3 為MLE指定回退機制 457

2.4 應用數據插值獲得混合和

匹配 458

2.5 應用困惑度評估語言模型 458

2.6 在建模語言中應用

梅特羅波利斯-黑斯廷斯算法 459

2.7 在語言處理中應用

吉布斯采樣 459

2.8 本章小結 461

第3章 詞語形態學—試一試 462

3.1 詞語形態學 462

3.2 詞根還原器 463

3.3 詞形還原 466

3.4 開發用于非英語語言的詞根

還原器 467

3.5 詞語形態分析器 469

3.6 詞語形態生成器 471

3.7 搜索引擎 471

3.8 本章小結 475

第4章 詞性標注—識別單詞 476

4.1 詞性標注 476

4.2 創建POS標注的語料庫 482

4.3 選擇某個機器學習算法 484

4.4 涉及n元組方法的統計建模 486

4.5 使用POS標注的語料庫開發

組塊器 491

4.6 本章小結 494

第5章 解析—分析訓練數據 495

5.1 解析 495

5.2 構建樹庫 496

5.3 從樹庫中提取上下文無關文法的

規則 501

5.4 從CFG中創建概率上下文無關的

文法 507

5.5 CYK圖解析算法 509

5.6 厄雷圖解析算法 510

5.7 本章小結 516

第6章 語義分析—意義重大 517

6.1 語義分析 517

6.1.1 NER簡介 521

6.1.2 使用隱馬爾可夫模型的

NER系統 525

6.1.3 使用機器學習工具包訓練

NER 530

6.1.4 使用POS標注的

NER 531

6.2 從Wordnet中生成同義詞集

ID 534

6.3 使用Wordnet消除歧義 537

6.4 本章小結 541

第7章 情感分析—我很高興 542

7.1 情感分析 542

7.2 使用機器學習的情感分析 548

7.3 本章小結 572

第8章 信息檢索—訪問信息 573

8.1 信息檢索 573

8.1.1 停用詞刪除 574

8.1.2 利用向量空間模型進行

信息檢索 576

8.2 向量空間評分以及與查詢

操作器交互 583

8.3 利用隱含語義索引開發IR

系統 586

8.4 文本摘要 587

8.5 問答系統 588

8.6 本章小結 589

第9章 話語分析—知識就是信仰 590

9.1 話語分析 590

9.1.1 使用定中心理論進行

話語分析 595

9.1.2 回指解析 596

9.2 本章小結 601

第 10章 NLP系統的評估—

性能分析 602

10.1 對NLP系統進行評估的

需求 602

10.1.1 NLP工具(POS標注器、

詞干還原器和形態分析器)

的評估 603

10.1.2 使用黃金數據評估

解析器 613

10.2 IR系統的評估 614

10.3 錯誤識別的指標 614

10.4 基于詞匯匹配的指標 615

10.5 基于語法匹配的指標 619

10.6 使用淺層語義匹配的

指標 620

10.7 本章小結 621

參考書目 622

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/533556.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/533556.shtml
英文地址,請注明出處:http://en.pswp.cn/news/533556.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

vue tab切換_iviewUITabs選項卡切換組件

概述 選項卡切換組件,常用于平級區域大塊內容的的收納和展現。源碼地址:https://github.com/iview/iview/tree/2.0/src/components/tabs使用: 標簽一的內容標簽二的內容標簽三的內容標簽二的內容在源碼的tabs文件下有三個文件:ind…

java biginteger 比較大小,java – 打印非常大的BigIntegers

我試圖找出與Java 7 x64中的BigIntegers相關的以下問題.我試圖計算一個極高功率的數字.代碼如下,然后是問題描述.import java.math.BigInteger;public class main {public static void main(String[] args) {// Demo calculation; Desired calculation: BigInteger("4096&…

paypal創建訂單后怎么獲得id_5步創建Facebook商店(最新版教程)學習如何在Facebook上賣貨...

請按照以下步驟設置Facebook商店:步驟1:轉到您的Facebook頁面并配置Shop頁面。步驟2:設置您的商店詳細信息。步驟3:配置付款。步驟4:將產品添加到您的Facebook商店。步驟5:管理您的訂單。步驟6:…

php 網絡圖片 轉本地,PHP將Base64圖片轉換為本地圖片并保存

PHP將Base64圖片轉換為本地圖片并保存/*** [將Base64圖片轉換為本地圖片并保存]* param [Base64] $base64_image_content [要保存的Base64]* param [目錄] $path [要保存的路徑]*/function base64_image_content($base64_image_content,$path){//匹配出圖片的格式if (preg_matc…

創建索引名稱已由現有對象使用_Excel編程周末速成班第3課:Excel對象模型

學習Excel技術,關注微信公眾號:excelperfect導語:為了幫助想要快速學會Excel VBA的朋友,特以《Excel Programming Weekend Crash Course》這本書為基礎,開始整理一系列資料,在完美Excel社群上分享。一共有3…

php修改htpasswd,用來解析.htpasswd文件的PHP類

.htpasswd 文件示例:user1:{SHA}kGPaD671VNU0OU5lqLiN/h6Q6acuser2:{SHA}npMqPEX3kPQTox/ZckHDrIcQIuser3:{SHA}q1Fh2LTUjjkncp11m0M9WUH5Zrwclass Htpasswd {private $file ;private $salt AynlJ2H.74VEfI^BZElc-Vb6G0ezE9a55-Wj;private function write($pairs …

socket用起始碼分割_常用條碼Code128碼及EAN13碼的介紹

在條碼打印軟件中,設計條碼標簽時經常用到的碼制是Code128碼和EAN13碼。因為這兩種碼制比較貼近我們的生活。比如:我們去超市購物,商品上貼的條碼標簽都是EAN13碼,因為EAN13碼多用于零售產品包裝。而code128碼多用于工廠產線&…

matlab在c盤有緩存文件夾嗎,win10如何清除C盤緩存文件-win10清除C盤緩存的方法 - 河東軟件園...

在電腦的使用過程中我們會發現磁盤的容量會不斷減小,更多時候其他磁盤還有很多剩余空間,C盤的存儲空間就已經達到極限了。其實在系統的升級和軟件的下載中很多文件就會默認儲存在C盤,時間久了以后,C盤不僅有軟件文件,還…

php 驗證碼字體居中,自定義驗證碼圖片的寬高后文本垂直水平居中[帝國cms ShowKey.php]-網站程序網...

define(EmpireCMSAdmin,1);define(EmpireCMSAPage,login);define(EmpireCMSNFPage,1);require(../class/connect.php);//繪制居中文本, 對于GD的內置字體function pc_ImageStringCenter($image,$text,$font){//字體大小$width array(1>5,6,7,8,9);$height array(1>6,8,…

python中的常量可以修改嗎_深入理解Python變量與常量

變量是計算機內存中的一塊區域,變量可以存儲規定范圍內的值,而且值可以改變。基于變量的數據類型,解釋器會分配指定內存,并決定什么數據可以被存儲在內存中。常量是一塊只讀的內存區域,常量一旦被初始化就不能被改變。…

java方法體邏輯不會寫怎么辦,想自己寫框架?不會寫Java注解可不行

用注解一時爽,一直用一直爽Java后端開發進入spring全家桶時代后,開發一個微服務提供簡單的增刪改查接口跟玩泥巴似的非常簡單,一頓操作猛如虎,回頭一看代碼加了一堆注解:Controller Autowired Value,面向注…

聯想拯救者y7000加內存條_短測聯想拯救者Y7000,到底值不值得買?

7000塊左右的筆記本電腦有什么好選擇,我相信這是很多人一直糾結的問題,雖然我用過的筆記本很多,但是這個價位的用的少之又少,但隨著十代酷睿標壓處理器的大量鋪貨,聯想拯救者Y7000進入了我的視線。那到底值不值得買呢&…

php適用于什么服務器,php – 找不到laravel類(適用于localhost但不適用于DO服務器)...

這是一個重復的問題 – 例如:Laravel 4 migrations – class not found但是,我已經嘗試了所有解決方案(來自我能找到的每個論壇)并且無法解決這個問題.腳本我在我的本地機器上創建了一個Laravel 4項目 – 添加了一些類,控制器,視圖等 – 項目運行良好.然后我將這個新…

python掃雷游戲課程設計小組任務計劃與分配表_python實現掃雷游戲

本文為大家分享了python實現掃雷游戲的具體代碼,供大家參考,具體內容如下本文實例借鑒mvc模式,核心數據為model,維護1個矩陣,0表無雷,1表雷,-1表已經檢測過。本例使用python的tkinter做gui,由于…

時間同步服務器java,Windows 配置時間同步服務器以及配置時間同步間隔

如何修改windows下的時間同步間隔操作步驟如下:打開注冊表:在“開始”菜單→“運行”項下(或按WinR)輸入“Regedit”進入注冊表編輯器。2.修改默認時間服務器IP:展開HKEY_LOCAL_MACHINE->SYSTEM->CurrentControlSet->Services->W…

房價python爬取_python爬取并解析 重慶2015-2019房價走勢

1 #! /usr/bin/env python2 #-*- coding:utf-8 -*-34 5 Created on 2019年11月24日67 author: Admin8 910 importrequests11 from lxml importetree12 importtime13 importcsv1415 16 方法名稱:spider17 功能: 爬取目標網站,并以源碼文本18 參…

PHP遞歸刪除目錄面試題,PHP 遞歸刪除目錄中文件

/*** 遞歸刪除目錄中文件* param $pathname* return bool*/public static function delDir($pathname)//要刪除的目錄{if(file_exists($pathname)) {if(is_file($pathname)) {unlink($pathname);} else {$dir opendir($pathname);while($filename readdir($dir)) {if($filena…

python中 12_python編程中常用的12種基礎知識總結

1、正則表達式替換目標: 將字符串line中的 overview.gif 替換成其他字符串>>> line >>> more.compile(r(?<SRC)"([\w\.])",re.I)>>> mo.sub(r"\1****",line)>>> mo.sub(rreplace_str_\1,line)< /span>>&…

php smarty分頁原理,SMARTY分頁詳解

<?phprequire_once (include/common.inc.php);//這里是個接口common.inc.php里面包函了一些常用到的函數類庫以及SMARTYinclude_once(header.php);//調用頭部信息,SESSION的信息全都保存在這里,這樣做的好處是幾乎所有的頁面都不需要在開頭輸入session_start();$smarty new…

python十個一行_python 如何將一系列數字十個一行輸出

展開全部答案如下&#xff1a;代碼詳解1、使用循環輸出列表&#xff0c;利用 計數器控制輸出數量&#xff0c;當輸出到第十個&#xff0c;62616964757a686964616fe4b893e5b19e31333365663532計數器歸零&#xff0c;重新開始計數2、print輸出增加end參數可以控制輸出后以什么結尾…