5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
11个月前
474
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java
9年多前
458
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要
5187 lionsoul 1578914315
371
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C
11个月前
273
结巴中文分词做最好的Python分词组件
Python
11年前
436788 rockyzheng 1578923827
241
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python
4年多前
5460443 baidu 1578992824
236
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
8919053 indexea 1673024392
204
基于 NLP 技术 ( HanLP ) 实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java
1天前
138
基于HanLP自然语言处理包的elasticsearch分词器
Java
1年多前
126
Go 语言高效分词, 支持英文、中文、日文等
Go
接近3年前
5008798 detachina 1721605378
80
快速中文分词分析word segmentation
Java
2年前
68
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
62
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java
6个月前
61
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java
接近7年前
1646371 tyoui 1578956781
61
该项目已经更换,在码云上不在更新,请更换地址如下。
Python
5年多前

Search