java 調用 ictclas50_1-Ictclas50分詞系統ForJava

Ictclas50是一個分詞庫,我嘛主要用來做中文分詞,其也能分出詞性等東西。

1.環境搭建

進入到下載頁面進行下載:

如下圖: 因為我的系統是64位的windows,所以選擇了到數第三行進行下載。其JAVA版本是通過JNI去調用dll庫,所以下載下來后沒有jar包。0818b9ca8b590ca3270a3433284dd417.png0818b9ca8b590ca3270a3433284dd417.png看到沒有,這就是下載下來后的所有東西,里面有Demo,Doc,API,Sample,主要就是Doc里面的文檔要去看一下,里面有實例代碼啥的。還有就是API,自然是用來開發用的。

0818b9ca8b590ca3270a3433284dd417.png把API文件夾里面的東西都拖入到你的工程中,其中ICTCLAS文件夾拖入工程目錄下的src文件夾中,這樣之后就可以開始使用里ICTCLAS50這個類進行分詞了。

2.測試:

查看下ICTCLAS50這個類里面的代碼可以看出,其很簡單,里面就幾個函數,具體用法參見doc文件夾里的文檔,里面都有說明和示例。

下面就是那幾個函數:0818b9ca8b590ca3270a3433284dd417.png

以下為測試代碼:

package test;

import java.io.UnsupportedEncodingException;

import ICTCLAS.I3S.AC.ICTCLAS50;

public class test {

/**

* @param args

*/

public static void main(String[] args) {

ICTCLAS50 ictclas50 = new ICTCLAS50();

String argu = ".";

try {

if (ictclas50.ICTCLAS_Init(argu.getBytes("GB2312")) == false)

{

System.out.println("Init Fail!");

}

String text = "loma在做一個分詞測試";

//分詞處理

byte nativeBytes1[] = ictclas50.ICTCLAS_ParagraphProcess(text.getBytes("GB2312"), 2, 0);

String nativeStr1 = new String(nativeBytes1, 0, nativeBytes1.length, "GB2312");

System.out.println(nativeStr1);

ictclas50.ICTCLAS_Exit();

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

}

}

輸出結果:

0818b9ca8b590ca3270a3433284dd417.png空格有點小,要睜大眼睛哦~

里面還能輸出詞性啥的,請看doc里面的文檔。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/371099.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/371099.shtml
英文地址,請注明出處:http://en.pswp.cn/news/371099.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SpringMVC亂碼或前臺亂碼解決辦法

JSP頁面亂碼 <% page language"java" import"java.util.*" pageEncoding"UTF-8"%> 以及 form表單提交方式為必須為post 修改web.xml&#xff0c;增加編碼過濾器&#xff0c;如下&#xff08;注意&#xff0c;需要設置forceEncoding參數值…

Beam概念學習系列之Pipeline Runners

不多說&#xff0c;直接上干貨&#xff01; https://beam.apache.org/get-started/beam-overview/ 在 Beam 管道上運行引擎會根據你選擇的分布式處理引擎&#xff0c;其中兼容的 API 轉換你的 Beam 程序應用&#xff0c;讓你的 Beam 應用程序可以有效的運行在指定的分布式處理引…

使普通的舊Java OSGi兼容

盡管OSGi在Java世界中越來越流行&#xff0c;但仍有許多Java應用程序和庫尚未設計成可在OSGi中使用。 有時您可能需要在OSGi環境中運行這樣的代碼&#xff0c;或者是因為您想利用OSGi本身提供的好處&#xff0c;或者因為您需要僅由該特定環境提供的某些功能。 通常&#xff0c;…

運行 java classnotfound_JAR運行出現ClassNotFoundException異常的解決辦法

2009年10月30日最近在弄個聊天室,由于要跟數據庫通信,用到了JDBC的3個jar,在eclipse里OK的,但布置到服務器壞事了,不知道怎么弄JDBC的3個jar了寫個autoStart.batjava -jar chatServer.jarpause運行報錯:F:\mydocuments\java project\socketTest\release>java -jar chatServe…

idea 創建多模塊依賴Maven項目

轉載地址&#xff1a; http://www.cnblogs.com/tibit/p/6185704.html idea 創建多模塊依賴Maven項目 本來網上的教程還算多&#xff0c;但是本著自己有的才是自己的原則&#xff0c;還是自己寫一份的好&#xff0c;雖然可能自己也不會真的用得著。 1. 創建一個新maven項目 2.…

移動端適配問題

適配問題 怎么適配iphone6 1px問題 為什么頁面與設計稿會出現偏差&#xff1f; dpr設備像素/ css像素&#xff0c;只有dpr等于1的時候&#xff0c;實際效果和設計稿的尺寸比例才是1:1。因為iPhone6的DPR&#xff08;設備像素比&#xff09;為2&#xff0c;設備像素為750&…

用Java彈出創建新的消息通知

首先創建JFrame作為彈出窗口。 在其中添加一些JLabel以包含信息&#xff0c;并在適當的位置分配它們&#xff0c;使其看起來像一條通知消息。 下面給出了示例代碼&#xff1a; String message You got a new notification message. Isnt it awesome to have such a notificat…

mysql游標表間數據遷移_FalseMySQL存儲過程--gt;通過游標遍歷和異常處理遷移數據到歷史表-mysql-第二電腦網...

-- 大表數據遷移,每天凌晨1點到5點執行,執行間隔時間10分鐘&#xff0c;遷移舊數據到歷史表。DELIMITER $$USE dbx$$電腦技術網對《FalseMySQL存儲過程-->通過游標遍歷和異常處理遷移數據到歷史表》總結來說&#xff0c;為我們程序員很實用。DROP PROCEDURE IF EXISTS pro_x…

課后作業-閱讀任務-閱讀筆記-2

好的單元測試的標準&#xff1a; 1>單元測試應該在最基本的功能/參數上驗證程序的正確性 2>單元測試必須由最熟悉代碼的人&#xff08;程序的作者&#xff09;來寫 3>單元測試后&#xff0c;機器狀態保持不變 4>單元測試要快&#xff08;一個測試的運行時間是幾秒鐘…

定位-固定定位

把box2設為固定定位&#xff1a; <!DOCTYPE html> <html lang"en" dir"ltr"><head><meta charset"utf-8"><title>定位</title><style media"screen">.box1{width:100px; height: 100px;ba…

垃圾自動回收

自動回收 自動回收的語言&#xff1a;根據變量是否還被引用&#xff0c;來確定是否應該回收Javascript內存泄露 由于js回調及閉包的特性&#xff0c;當方法嵌套太多的時候&#xff0c;可能回最外層的變量可能一直都被引用著&#xff0c;這樣就導致變量一直沒有被回收&#xff0…

Java并發執行器的懶惰開發人員簡介

如果我告訴您util.concurrent API自2004年起提供此類服務&#xff0c;我就會自欺欺人。但是&#xff0c;我想回顧一下一些很酷的功能。 并發專家&#xff0c;現在是時候關閉該窗口了。 所有其他人&#xff0c;請緊緊抓住樂趣。 你不會忘記你的根源 執行程序是具有單個執行方法…

《我們應該怎樣做需求分析》閱讀筆記

認識&#xff1a;軟件需求分析是貫穿軟件項目從出生到成長或者死亡的&#xff0c;我們必須搞清楚到手的軟件是為了什么要做什么做成什么樣&#xff0c;通過顧客的描述彼此的合作分析需求與業務邏輯&#xff0c;不斷改進從而實現軟件在合理范圍內符合顧客要求。 怎么做&#xff…

Java代碼格式化算法_一個時間格式化的工具類:TimeUtil

源代碼如下&#xff1a;import android.content.Context;import android.text.TextUtils;import android.text.format.DateUtils;import java.text.Format;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import java.util.regex.Matcher…

(轉)VS2010/MFC編程入門之前言

雞啄米的C編程入門系列給大家講了C的編程入門知識&#xff0c;大家對C語言在語法和設計思想上應該有了一定的了解了。但是教程中講的例子只是一個個簡單的例程&#xff0c;并沒有可視化窗口。雞啄米在這套VS2010/MFC編程入門教程中將會給大家講解怎樣使用VS2010進行可視化編程&…

JavaOne 2012:JavaFX圖形技巧和竅門

我回到希爾頓&#xff08;皇家宴會廳B&#xff09;看了Richard Bair的&#xff08;Oracle Java客戶架構師&#xff09;的“ JavaFX圖形技巧和竅門”。 Bair與FX Experience相關聯&#xff0c;并且顯然了解JavaFX。 拜爾說&#xff0c;他演講的主題是表演。 他告誡說&#xff0c…

web前端知識點1

1. input屬于窗體元素,層級顯示比flash、其它元素都高。請判斷這句話的正確與否。 錯誤 層級顯示優先級&#xff1a; frameset > 表單元素 > 非表單元素 在html中&#xff0c;幀元素&#xff08;frameset&#xff09;的優先級最高&#xff0c;表單元素比非表單元素的優…

18. 使用模板【從零開始學Spring Boot】

轉&#xff1a;http://blog.csdn.net/linxingliang/article/details/52017098 18.1 使用thymeleaf 整體步驟&#xff1a; &#xff08;1&#xff09; 在pom.xml中引入thymeleaf; &#xff08;2&#xff09; 如何關閉thymeleaf緩存 &#xff08;3&#xff09; …

java單元測試算初級_Java____Eclipse下JUnit單元測試(初級)

給大家分享一個鏈接希望對你們有幫助 http://blog.csdn.net/huangbiao86/article/details/6709742今天看圖片命名唯一的策略時看到有個大大用JUnit測試&#xff0c;神奇的樣子&#xff0c;遂上網搜集來三篇JUnit測試的入門文章&#xff0c;作為參考。原作地址在上面&#xff0c…

Hadoop + Amazon EC2 –更新的教程

在Hadoop的Wiki頁面上放置了一個舊教程&#xff1a; http : //wiki.apache.org/hadoop/AmazonEC2 &#xff0c;但是最近我不得不遵循本教程&#xff0c;并且我注意到它沒有涵蓋某些Amazon新功能。 建議您已經熟悉Hadoop的基礎來遵循本教程&#xff0c;可以在Hadoop的主頁http:…