Universal Dependencies(通用依存句法,常简称 UD):一种跨语言统一的依存句法标注框架与树库(treebank)项目,为不同语言提供一致的词类(POS)、形态特征与依存关系标签,便于多语言研究、句法分析与自然语言处理模型的训练与评测。
/ˌjuːnɪˈvɜːrsəl dɪˈpɛndənsiz/
Universal Dependencies is used to annotate sentences in many languages.
Universal Dependencies 用于给多种语言的句子做标注。
By converting our corpus into Universal Dependencies format, we can compare parsing results across languages and tools more reliably.
通过把我们的语料转换成 Universal Dependencies 格式,我们可以更可靠地在不同语言和工具之间比较句法分析结果。
该术语由两部分组成:universal(“通用的、跨语言适用的”)强调标注体系的跨语言一致性;dependencies源自依存语法传统,指用“中心词—依存词”的关系来表示句子结构。作为专名时,Universal Dependencies指一个由学术社区推动的统一标注规范与数据共享生态。