Nov
21
现代汉语语料库加工规范
——词语切分与词性标注
⒈ 前言
北大计算语言学研究所从1992 年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范V1.0》。几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范V2.0》(征求意见稿)。因这次加工的任务超出词语切分与词性标注的范围,故将新版的规范改名为《现代汉语语料库加工规范》。
Nov
21
郭 锐
On the notation of parts of speech in Chinese dictionary
Guo Rui
零 引言
本文讨论词典标注词性的必要性、标注词性的可能性和困难、现代汉语的内部分层和词性标注、词性标注应注意的问题四方面问题。
本文所依据的汉语词类体系是朱德熙、陆俭明、郭锐承担的国家七五社科项目“现代汉语词类研究”的体系。简介如下:
On the notation of parts of speech in Chinese dictionary
Guo Rui
零 引言
本文讨论词典标注词性的必要性、标注词性的可能性和困难、现代汉语的内部分层和词性标注、词性标注应注意的问题四方面问题。
本文所依据的汉语词类体系是朱德熙、陆俭明、郭锐承担的国家七五社科项目“现代汉语词类研究”的体系。简介如下:
Nov
21
Nov
13
chkconfig命令可以用来检查、设置系统的各种服务。
这是Red Hat公司遵循GPL规则所开发的程序,它可查询操作系统在每一个执行等级中会执行哪些系统服务,其中包括各类常驻服务。
使用语法:
chkconfig [--add][--del][--list][系统服务] 或 chkconfig [--level <等级代号>][系统服务][on/off/reset]
Nov
13
由于之前的服务器是原来的设计师配置的,现在需要重新再配置服务器。只好自己学着配置吧。
步骤1:安装samba
#apt-get install samba
#apt-get install smbfs
步骤1:安装samba
#apt-get install samba
#apt-get install smbfs