crf++是一款非常常用的變成開源工具,主要用于文本標注、分詞等等,用戶可以非常輕松的的完成各種變成任務(wù)。目前,crf++是國內(nèi)最實用的一款軟件,深受廣大程序員們的喜愛。還在等什么!快來旋風軟件園下載吧!
doc文件夾:就是官方主頁的內(nèi)容
example文件夾:有四個任務(wù)的訓練數(shù)據(jù)(test.data)、測試數(shù)據(jù)(train.data)和模板文件(template),還有一個執(zhí)行腳本文件exec.sh。
libcrffpp.dll:訓練程序和測試程序需要使用的靜態(tài)鏈接庫。
clr_learn.exe:crf++的訓練程序
crl_test.exe:crf++的測試程序
sdk文件夾:crf++的頭文件和靜態(tài)鏈接庫。
條件隨機場(crf)由lafferty等人于2001年提出,結(jié)合了最大熵模型和隱馬爾可夫模型的特點,是一種無向圖模型,近年來在分詞、詞性標注和命名實體識別等序列標注任務(wù)中取得了很好的效果。條件隨機場是一個典型的判別式模型,其聯(lián)合概率可以寫成若干勢函數(shù)聯(lián)乘的形式,其中最常用的是線性鏈條件隨機場。若讓x=(x1,x2,…xn)表示被觀察的輸入數(shù)據(jù)序列,y=(y1,y2,…yn)表示一個狀態(tài)序列,在給定一個輸入序列的情況下,線性鏈的crf模型定義狀態(tài)序列的聯(lián)合條件概率為
p(y|x)=exp{} (2-14)
z(x)={} (2-15)
其中:z是以觀察序列x為條件的概率歸一化因子;fj(yi-1,yi,x,i)是一個任意的特征函數(shù);是每個特征函數(shù)的權(quán)值。
1、解壓后將crf_learn.exe crf_test.exe libcrfpp.dll文件復制到example文件夾的任意文件夾下
2、打開cmd命令行模式cd到1中目錄。
3、輸入指令crf_learn template train.data model即可生成model文件
大小:434KB / 版本:v0.58 官方版
大小:10.32M / 版本:v0.58 官方版
大小:128.90M / 版本:v0.58 官方版
大小:17.77M / 版本:v0.58 官方版
大小:166.00M / 版本:v0.58 官方版
大小:53.35M / 版本:v0.58 官方版
大小:78.17M / 版本:v0.58 官方版
大小:4.84M / 版本:v0.58 官方版
大小:34.58M / 版本:v0.58 官方版
大小:3.03M / 版本:v0.58 官方版
大小:891.00M / 版本:v0.58 官方版
大小:20.40M / 版本:v0.58 官方版