土著语言事关和平与发展

2019-04-18

在促进网络空间语言多样性和多语制的同时,我们每天都在发掘新的用户和合作伙伴。土著人民的参与已成为可持续发展进程中必不可少的一部分。

联合国教科文组织于世界信息论坛期间举办的高级别小组会议传递了一个重要理念——通过信息通信技术促进语言多样性和多语制有助于保护、获取和传播语言中蕴含的宝贵传统知识。要想在这一过程中取得丰硕成果并开发有效的语言技术,关键是从技术研发工作的最初阶段就让土著人民和土著语言使用者参与其中。2019年世界信息系统论坛于4月10日在日内瓦召开。

语言数字鸿沟

专题研究小组成员讨论了关于通用语言使用者和少数民族语言使用者之间日益扩大的数字鸿沟问题,导致该问题的原因是土著语言使用者缺少可利用的资源和可获取的技术。

从基础的语法和拼写检查器,到复杂的自动摘要、搜索引擎、语音识别等,只有极少数语言技术是根据使用率较低的少数民族语言开发的。萨米议会,通过与北极挪威大学(特罗姆瑟)合作, 致力于开发萨米人可使用的免费技术,包括计算机和手机键盘,拼写和语法检查,机器翻译系统。分享类似的实践案例、知识和策略,为缩小土著人民的数字鸿沟描绘了发展道路:

“我们正努力在世界各地的土著人中间塑造一种驱动力量,以敦促主流科技公司承担起他们的责任;我们希望,通过实施保护和支持土著语言数字化的立法,各国政府能够致力于改善土著语言使用者的处境。“

 —— 挪威萨米议会政治顾问拉森(Lásse-Ivvár Erke)

世界知识产权组织根据2016年制定的“开放获取政策”落实了另一项相关措施——鼓励其网站翻译和再版不同土著语言的出版物。正如知识产权组织土著问题研究员弗格伦(Rebecka Forsgren)所指出的,该措施有助于土著人民传统知识的传播和知识产权的保护。

挑战

一系列的政治、文化、社会经济和技术的挑战阻碍了少数民族语言和低使用率语言的语言技术发展和主流化。法国国家科学研究中心(CNRS)机械和计算机工程实验室(LIMSI)荣誉退休研究主任马里亚尼(Joseph Mariani)教授强调说,开发语言技术需要两个基本的“成分“:语言资源(语料库、词典、术语数据库等)和语言技术评估。目前,大多数技术都基于人工智能机器学习,因而需要大量的数据(数十亿的词汇、数千小时的语音)支撑。数据越多,系统就越好。但并非所有语言都有丰富的数据库,而且少数民族语言的使用者也缺少适当的方法或技能来制定其在线推广本民族语言的策略。因此,我们需要加强资料编制工作,以确保少数民族语言可以世代相传。

在当今世界,信息通信技术相关的数字素养和快捷的宽带连接是实现人权和参与社会生活的先决条件。然而一些土著社区由于处于偏僻的乡村,电力和互联网难以覆盖,而且50%的线上内容仍使用英语,因此这些社区难以利用互联网资源。这一比例与语言的线下使用量形成鲜明对比。就此而言,口语的使用场景更为有趣,因为那些不会读写的人只需要使用简单、便宜且易得的手机就可以进行交流。

与此同时,私营组织也越来越多地支持多种语言的使用,它们的重点从专注于GDP总量较高的国家的语言向开发多语种语言技术转移,包括少数民族语言和GDP价值较低国家所使用的语言。正如牛津信息实验室首席执行官泰勒(Emily Taylor)所强调的,国际化域名(IDNs)在提高网络空间语言多样性方面具有巨大潜力。自2011年以来,教科文组织在Verisign公司和区域域名(ccTLD)组织的支持下,与EURid合作编写了《全球国际化域名报告》。

未来之路:多方合作

为土著语言用户提供必要的技术工具,使他们也能从最新的数字化发展中受益, 需要包括土著语言用户本身、公共和私营部门、学术界和民间社会组织在内的众多利益攸关方的共同努力。

建立多方利益攸关者的合作关系是2019 国际土著语言年行动计划的关键支柱之一。汇集多方的具体思考对于调整技术和人工智能以使其服务于所有语言至关重要。事实上,世界上95%的语言是使用人口仅占全球总数的6%,因而有必要提出新的研究方向和经营策略以降低发展土著语言的技术成本,并鼓励国际层面的知识共享,以提升技术研发的利润率并促进全球发展。

作为“国际土著语言年”活动的牵头机构,教科文组织与会员国、联合国各机构、国际语言年组织指导委员会成员和其他伙伴紧密合作,成功制定了《2019国际土著语言年行动计划》。并在以下5个方面采取和规划了一系列活动和措施:

  • 增进不同利益攸关方之间的理解、和解和国际合作:在巴黎(2019年1月28日)和纽约(2019年2月1日)举办2019国际土著语言年全球启动仪式、区域活动和全球会议;
  • 为知识共享和实践范例的传播创造有利条件(2019年世界信息与通信技术高级别对话、WSIS论坛、联合国教科文组织-知识产权组织土著语言活动);
  • 将土著语言纳入标准化体系(2019国际土著语言年行动计划);
  • 通过能力培养使土著人民拥有权利(2019年3月新加坡土著语言黑客马拉松活动);
  • 详细阐述新知识以促进经济增长与社会发展(2019国际土著语言年研究论文、即将发布的2019年世界语言报告)。

此外,教科文组织在落实2003年《关于普及网络空间及提倡和使用多种语言的建议》的框架内,提出了若干促进网络空间知识获取的具体措施,包括土著语言使用者的知识获取。

 

更多关于2019国际土著语言年(IYIL2019)的信息: