Python 封装
Stanford CoreNLP 的网站中,已经列举出许多种封装。这些packages都是通过启动 Stanford CoreNLP server,然后向server发送请求,达到调用的目的。但这些包有的早已停止更新,不能同当前的版本(3.9.2)兼容,有的使用方法比较复杂,有的则缺失一些关键性的功能(比如分句)。
为了解决上面这些问题,我对 Lynten/stanford-corenlp 的代码进行了维护,修正了一些bug。修改后的代码在原来的基础上,增加了:
- 兼容Stanford CoreNLP最新版本(v3.9.2)
- 分词方法
word_tokenize()
可以正常使用(原版本存在bug) - 增加了分句方法
sent_split()
代码地址为: https://github.com/styxjedi/stanford-corenlp
如果在使用过程中遇到问题,可以在这个仓库中提 issue,我会尽快解决。