Firstly,the system generated the top N segmentation results as a candidate sets by the approach based on dictionary combined with uni-gram statistical model.
首先基于词典和一元语法统计模型生成N个最优结果作为候选集;然后对候选集进行基于二元语法统计模型的词性标注,最后利用对文本的上下文"理解"信息来确定最佳切分结果。
We propose several algorithms for topic tracking,and adopt unigram model for Chinese topic tracking .
本文对中文新闻报道中的话题跟踪进行了研究,提出并探索了多种不同的算法,并提出了利用一元语法模型来进行话题跟踪。