weka 初練之文本分類

weka 初練之文本分類

news/2025/7/12 10:36:25/文章來源:https://blog.csdn.net/weixin_30493401/article/details/96289568

0.注意weka的中文編碼
RunWeka.ini-----》fileEncoding=utf-8
1.首先對分詞后的無新詞發現的分詞文件，轉換成arff文件命令
java weka.core.converters.TextDirectoryLoader -dir D:\weibo\catagory\data10W\nlpirSegment\noNI > D:\weibo\catagory\data10W\nlpirSegment\weka\wb10w.arff
發現轉換特別快
2.打開上面的文件進行生成詞向量，首先選擇通過特征的有無，1000特征/每類文檔，最后保存當前文件 wb10w_vsm_true_false_weight.arff
生成6千多個特征
3.打開上面的arrf文件，進行特征選擇，評估策略選擇 IG，搜索策略選擇Ranker 特征數5000，保存文件wb10w_as_true_false_weight.arrf
4.bayes 分類器 66訓練數據結果復制到 result文件中

轉載于:https://www.cnblogs.com/dasheng-maritime/p/6160403.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/253806.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/253806.shtml
英文地址，請注明出處：http://en.pswp.cn/news/253806.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

[COGS 0065][NOIP 2002] 字串變換

[COGS 0065][NOIP 2002] 字串變換

65. [NOIP2002] 字串變換 ★★ 輸入文件：string.in 輸出文件：string.out 簡單對比時間限制：1 s 內存限制：128 MB [問題描述] 已知有兩個字串A\$, B\$及一組字串變換的規則（至多6個規則）: A1\$ ->…

閱讀更多...

基與datatable的分頁

基與datatable的分頁

在進行分頁操作前，必須知道開啟服務器模式后會向服務器發送的參數的含義： length:告訴服務器每頁顯示的數據條數 start：第一條數據的起始位置 draw:繪制計數器，（特殊：服務器接收到參數后，需要返…

閱讀更多...

linux sock_raw原始套接字編程

linux sock_raw原始套接字編程

sock_raw原始套接字編程可以接收到本機網卡上的數據幀或者數據包,對與監聽網絡的流量和分析是很有作用的.一共可以有3種方式創建這種socket1.socket(AF_INET, SOCK_RAW, IPPROTO_TCP|IPPROTO_UDP|IPPROTO_ICMP)發送接收ip數據包2.socket(PF_PACKET, SOCK_RAW, htons(ETH_P_IP|E…

閱讀更多...

邏輯綜合——施加約束

邏輯綜合——施加約束

Design Compiler時一個約束驅動（constraint-driven）的綜合工具，它的結果與設計者施加的約束條件密切相關。一、面積約束進行面積的約束，也就是告訴DC綜合的電路面積要在多少以內。在介紹約束命令之前，先了解一下面積…

閱讀更多...

[Codevs] 1004 四子連棋

[Codevs] 1004 四子連棋

1004 四子連棋時間限制: 1 s空間限制: 128000 KB題目等級 : 黃金 Gold題目描述 Description在一個4*4的棋盤上擺放了14顆棋子，其中有7顆白色棋子，7顆黑色棋子，有兩個空白地帶，任何一顆黑白棋子都可以向上下左右四個方向移動到相鄰…

閱讀更多...

鏈接中獲取文件名

鏈接中獲取文件名

算得上是-test.pdf 獲取文件名 var str http://aaa.com/s/ddd/算得上是-test.pdf; console.log(str.match(/([^/*.])\.\w$/)) console.log(str.match(/([^/*.])\.\w$/)[0]) // 轉載于:https://www.cnblogs.com/cssfirefly/p/6163370.html

閱讀更多...

邏輯綜合——優化電路

邏輯綜合——優化電路

對進行時序路徑、工作環境、設計規則等進行約束完成之后，DC就可以進行綜合、優化時序了，DC在優化過程中主要的策略將在下面進行說明。然而，當普通模式下不能進行優化的，就需要我們進行編寫腳本來改進DC的優化來達到時序要求。 DC…

閱讀更多...

DOM包裹wrap()方法

DOM包裹wrap()方法

DOM包裹wrap()方法如果要將元素用其他元素包裹起來，也就是給它增加一個父元素，針對這樣的處理，JQuery提供了一個wrap方法 .wrap( wrappingElement )：在集合中匹配的每個元素周圍包裹一個HTML結構簡單的看一段代碼： &…

閱讀更多...

usleep函數

usleep函數

usleep功能把進程掛起一段時間， 單位是微秒（百萬分之一秒）； 頭文件： unistd.h 語法: void usleep(int micro_seconds); 返回值: 無內容說明：本函數可暫時使程序停止執行。參數 micro_seconds 為要暫停的微…

閱讀更多...

限制Xamarin獲取圖片的大小

限制Xamarin獲取圖片的大小

限制Xamarin獲取圖片的大小在App開發中，經常會使用網絡圖片。因為這樣不僅可以減少App的大小，還可以動態更新圖片。但是手機使用網絡環境千差萬別。當網絡環境不是理想的情況下，加載網絡圖片就是一個棘手的問題了。為了避免長時間加載圖片影響…

閱讀更多...

Linux應用開發自學之路

Linux應用開發自學之路

前言在「關于我」那篇博文里，朋友們應該知道了我不是科班出身，是由機械強行轉行到Linux應用開發方向。下面我就詳細向大家介紹自己這一路上的轉行歷程，希望對大家有所啟發。我是學機械專業的，對于機械專業我還是很感興趣&…

閱讀更多...

Verdi 基礎教程

Verdi 基礎教程

一、Verdi 功能查看設計debugVerdi不能自己產生波形二、Verdi使用流程 1、Verdi環境配置 .bashrc中配置 export Verdi_HOME$Synopsys_Dir/Verdi2015 #export NOVAS_HOME$Synopsys_Dir/Verdi2015 export PATH$Verdi_HOME/bin:$PATH export LD_LIBRARY_PATH"/opt/Syno…

閱讀更多...

ida和idr機制分析（盤符分配機制）

ida和idr機制分析（盤符分配機制）

內核ida和idr機制分析（盤符分配機制） ida和idr的機制在我個人看來，是內核管理整數資源的一種方法。在內核中，許多地方都用到了該結構（例如class的id，disk的id），更直觀的說&#xff0…

閱讀更多...

MIPI CSI-2學習

MIPI CSI-2學習

CSI（Camera Serial Interface）定義了攝像頭外設與主機控制器之間的接口，旨在確定攝像頭與主機控制器在移動應用中的標準。關鍵詞描述縮寫解釋CCICamera Control Interface（物理層組件，通常使用I2C或I3C進行通信&…

閱讀更多...

internet網絡 checksum校驗和計算方法

internet網絡 checksum校驗和計算方法

http://hi.baidu.com/%CE%C4%B3%AD%B9%AB/blog/item/7d9a4e08f82d72b32eddd4cb.html

閱讀更多...

最有效的創建大數據模型的6個技巧

最有效的創建大數據模型的6個技巧

數據建模是一門復雜的科學，涉及組織企業的數據以適應業務流程的需求。它需要設計邏輯關系，以便數據可以相互關聯，并支持業務。然后將邏輯設計轉換成物理模型，該物理模型由存儲數據的存儲設備、數據庫和文件組成。歷史上&#xff…

閱讀更多...

【轉】Castle Windsor之組件注冊

【轉】Castle Windsor之組件注冊

【轉】Castle Windsor之組件注冊注冊方式較多，大體有這么幾種，學習得比較粗淺，先記錄：1、逐個注冊組件即對每個接口通過代碼指定其實現類，代碼：container.Register(Component.For<IMyService>() //接…

閱讀更多...

Verilog 補碼加法溢出判斷及處理

Verilog 補碼加法溢出判斷及處理

補碼加法運算溢出判斷三種方法： 一、符號位判斷 Xf、Yf分別兩個數的符號位,Zf為運算結果符號位。當Xf Yf 0（兩數同為正）,而Zf1(結果為負)時,負溢出；當出現Xf Yf 1（兩數同為負）,而Zf0（結果為…

閱讀更多...

Android繪制(三):Path結合屬性動畫, 讓圖標動起來!

Android繪制(三):Path結合屬性動畫, 讓圖標動起來!

Android繪制(一):來用shape繪出想要的圖形吧! Android繪制(二):來用Path繪出想要的圖形吧! 目錄效果圖前言繪制屬性動畫最后效果圖不廢話, 直接上效果圖, 感興趣再看下去. 其實不單單是效果圖演示的, 運用熟練的話各種圖標之間都是可以切換的. 前言之前的文章也說了, path還…

閱讀更多...

u-boot_NAND_Flash操作命令及燒錄Linux內核和文件系統

u-boot_NAND_Flash操作命令及燒錄Linux內核和文件系統

閱讀更多...

最新文章