中文分词¶
服务概述¶
中文分词指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。新浪云分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。
分词服务主要用于中文语义分析。常用应用场景如:
- 对博客标题进行分词,提取其中的名词作为文章关键词。
- 对用户搜索条件进行分词,提取其中关键词语进行搜索。例如,用户搜索”新浪云的文件写入”,可分词为“新浪云”、“文件”、“写入”三个关键词来进行搜索,提高搜索成功率。
分词服务当前已经支持从公网直接访问,请参考 API接口文档 ,PHP使用SDK参考 分词服务PHP SDK 。