收到的对庖丁的几个要求
|
Qieqie
2007-08-10
根据这两天友善的同学们给我的反馈,庖丁暂时收到有这几个方面要求:
1、编译成较低JDK版本的JAR包[目前打的JAR包是JDK6.0的,一部分人应该下载源代码后自己打包成符合自己环境的版本-还好这不是不可解决的] 2、字典的保存和读取强制采用UTF-8编码格式 3、支持运行时修改、添加、删除字典以及字典目录(可配置间隔时间) 4、支持把繁体字的UTF-8编码,等价转化于对应字的简体UTF-8进行,后进行分词(也就不再另外有专门的繁体词典)-是否可行? 5、庖丁不需要去保证能够正确处理非UTF-8编码的文本。对于GBK(GB2312),big5等编码的文本,都应在提交给庖丁之前就已经转为UTF-8编码。 |

