博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
中文自然语言处理工具HanLP源码包的下载使用记录
阅读量:5821 次
发布时间:2019-06-18

本文共 810 字,大约阅读时间需要 2 分钟。

hot3.png

这篇文章主要分享的是hanlp自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用,同时算是给新手朋友的一些参考吧!

不过在此之前先推荐两本书给想要学习中文自然语言处理的朋友,分别是《NLP汉语自然语言处理原理与实战》,里面介绍了汉语自然语言处理的相关技术,还有一些源码的解读;另一本是《python自然语言处理》。

下面就进入到本篇的正题,其实只需要下载源代码,下载字典和模型数据文件、下载配置文件,并且对配置文件稍作修改,然后再使用IDE打开源代码,就可以运行了,总的来说整个过程其实并不复杂。源代码、字典以及模型、配置文件的下载大家可以到GitHub上下载。

网页中提供了详细的说明,其实按照说明来就可以,下载以后将字典和模型文件解压到一个目录,建议放在工程名目录下:

 

data中就是模型文件和字典数据文件:

通过github提供的源代码下载链接下载下来的文件不包含hanlp.properties配置文件,这是你需要下载一个release版本的代码,解压以后,里面有一个hanlp.properties文件

将这个文件分别拷贝到解压以后的源代码target/classes和target-classes目录下

 

最后用ide打开源代码,我使用的ide工具是IDEA(Intellij),其他ide的操作应该大同小异,当然配置文件也许只需要一份就够了,不需要两个目录都拷贝,我这里没有验证,为保险起见,两个目录下都拷贝一份,读者可以试验一下,我这里主要目的是为了能跑通。

 

上述步骤完成之后,打开src/test/java/com.hankcs/demo下的demo,就可以跑出结果了,接下来,就顺藤摸瓜去读源代码吧

转载于:https://my.oschina.net/u/3793864/blog/3010302

你可能感兴趣的文章
使用Unity3D引擎开发赛车游戏
查看>>
HTML5新手入门指南
查看>>
opennebula 开发记录
查看>>
ubuntu 修改hostname
查看>>
sql 内联,左联,右联,全联
查看>>
C++关于字符串的处理
查看>>
6、Web Service-拦截器
查看>>
Flask 源码流程,上下文管理
查看>>
stream classdesc serialVersionUID = -7218828885279815404, local class serialVersionUID = 1.
查看>>
ZAB与Paxos算法的联系与区别
查看>>
java 读取本地的json文件
查看>>
Breaking parallel loops in .NET C# using the Stop method z
查看>>
Android Content Provider Guides
查看>>
修改故障转移群集心跳时间
查看>>
[轉]redis;mongodb;memcache三者的性能比較
查看>>
微软职位内部推荐-Sr DEV
查看>>
用计算器计算“异或CRC”
查看>>
让你的WPF程序在Win7下呈现Win8风格主题
查看>>
JDBC二查询(web基础学习笔记八)
查看>>
监听器(web基础学习笔记二十二)
查看>>