商务部2021年公布《中国禁止出口限制出口技术目录》(以下简称《目录》)。
一、我国禁止出口限制出口的语言技术种类
《目录》第96条计算机服务业领域(编号2161010X)规定以下19项信息处理技术禁止出口限制出口,具体包括:(1)智能汉字语音开发工具技术,(2)字符式汉字显示控制器的设计、制造工艺,(3)计算机中文系统的核心关键技术,(4)工程图纸计算机辅助设计(CAD)及档案管理系统光栅/矢量混合信息处理方法,(5)中文平台技术(中文处理核心技术),(6)信息存取加、解密技术,(7)中译外翻译技术(机器翻译系统得分>4.5分),(8)少数民族语言处理技术,(9)汉语及少数民族语言的语音识别技术,(10)汉字压缩、还原技术,(11)印刷体汉字识别技术、程序结构、主要算法和源程序,(12)Videotex(可视图文)系统的汉字处理技术及网间控制技术,(13)具有交互和自学习功能的脱机手写汉字识别系统及方法,(14)用于计算机汉字输入识别方法中的手写体样张、印刷体样张以及汉语语料库,(15)汉字识别的特征抽取方法和实现文本切分技术的源程序,(16)汉语及少数民族语言的语音合成技术,(17)汉语及少数民族语言的人工智能交互界面技术,(18)汉语及少数民族语言的智能阅卷技术,(19)基于数据分析的个性化信息推送服务技术。由此可见,语言服务涉及语言安全。语言安全指为维护国家安全利益,采取必要措施,应对一切威胁和危害国家安全的语言行为和事件,维护国民、国土、主权、政治、军事、经济、文化、科技、教育、生态、信息、资源等各类安全。发展语言服务产业应该维护国家安全,特别是语言安全,包括语言文字安全、语言资源安全和语言技术安全。
二、发展语言服务产业要维护语言安全
(一)发展语言服务产业应该维护语言文字主权安全
语言文字安全指网络和数字化时代确保我国的通用语言文字的主权、所有权、使用权、发展权和传播权不受到干扰,纯洁语言文字表达,减少语言威胁与侵害而做出的各种努力行为。
发展语言服务产业要坚持维护中文的主权地位和汉字主体地位,同时有效保障和发展民族语言文字。语言主权安全指以维护国家通用语言文字的法定地位为主要内容,在管辖区域内自主自决推行语言文字事业的意志行为。语言是主权的象征,是国家身份与民族认同的基石。许嘉璐先生早就指出,语言文字问题始终关系到国家和民族的主权,公民的人权。
发展语言服务产业对内要维护中文的主权与权威地位。《中华人民共和国宪法》《中华人民共和国国家通用语言文字法》《中华人民共和国义务教育法》从法律层面确定了中文的通用语地位,其主权安全地位受到法律保护。语言主权安全有利于维护国家主权和民族尊严,增强各民族的凝聚力,助力中华民族共同体的构建。对于语言服务行业出现危害国家及社会的语言行为坚决曝光整改,确保国家语言文字工作的严肃性与权威性。
发展语言服务产业对外要维护中文的主权和国际地位。中文是联合国的官方语言之一,国际场合使用中文服务是国家主权的体现。语言服务对外合作和交流要维护国家语言主权的安全与权威,坚持使用中文,体现我国的国际地位与主权意识。随着我国综合国力的增强,我国主办或者参与的国际重大经贸、体育赛事、文旅展会等活动日益增多,为这些经贸往来和人文交流提供语言服务的机会越来越多,语言服务企业和个人要从语言国家语言主权安全的高度提高政治站位,坚决纠正损害我国语言文字主权的错误言行。从语言主权安全入手,完善国家语言安全的法律法规,加大监管力度,集中排查,发现企业问题,采取约谈、集中曝光、责令整改等措施,确保语言服务企业合规经营,确保语言主权安全不受侵犯。
发展语言服务产业要从总体国家安全观的高度出发,自觉维护中文的纯洁性、稳定性、规范性、独立性与完整性,坚持通用语言文字形成的价值标准,筑牢中华民族共同体意识,传承和弘扬中华优秀语言文字和文化传统。
(二)发展语言服务产业应该维护语言资源安全
语言资源安全指一个国家对中外语言、少数民族语言、方言等口头、书面语言资源和语言衍生资源保护、开发与利用,以便保质保量、及时持续、稳定可靠、经济合理地获得语言人力、语言信息、文化教育等资源,以及资源保障的相关技术和行政保护,防范风险和威胁。
信息科技和人工智能迅速发展,产生海量语言资源。例如,近日国家语委主导建设的国家语言资源服务平台汇聚了近百项高质量语言资源服务成果。平台收录资源涵盖语言教育、语言文化、语言翻译、语言技术等公共语言资源。这些海量语言资源对发展我国的语言服务产业,提升语言资源服务能力至关重要。
《目录》中提及的汉字语音开发工具技术、计算机中文系统的核心关键技术、中文处理核心技术、信息存取加、解密技术、中译外翻译技术、少数民族语言处理技术、语音识别、语音合成基础,是进行汉语、少数民族语言、外语资源转换、管理、收集、整合、发布的一条龙技术。语言服务企业要高度重视语言相关技术安全,特别是与机器翻译有关的中外语言、少数民族语言的语料库、术语库、规则库等资源的开发和利用不受干扰和破坏。近年来,语言服务技术迅速发展,智能语言技术深度融合在线教育,为国家留下了大量宝贵的语言教育资源。智能阅卷技术的发展,对自动评测语言起到了推动作用,保留了大量的语言学习资源,这些负载丰富国民和青少年学生学习水平和行为习惯的大数据信息直接反应我国人口素质和教育竞争力,语言服务企业要自觉维护语言数据资产和相关技术的安全,合理开发和依法保护语言资产不受侵害和非法传播。
(三)语言服务产业应该维护语言技术安全
语言技术安全指采用通信和媒体技术、互联网和云计算技术、自然语言处理技术等开展语言信息处理、语言技术创新过程中的技术安全风险防范。语言智能化程度越高,技术风险就越大。语言技术创新和技术应用时进行对来自内外部的技术安全威胁和潜在风险的防范。
近年来,基于数据分析的个性化信息推送服务技术发展迅速,相关技术以用户行为习惯为切入点,通过抓取用户的搜索、语言、阅读等习惯,实现了互联网时代内容的智能传播。本次《目录》明确了基于数据分析的个性化信息推送服务技术的界定范围,主要包括基于海量数据持续训练优化的用户个性化偏好学习技术、用户个性化偏好实时感知技术、信息内容特征建模技术、用户偏好与信息内容匹配分析技术、用于支撑推荐算法的大规模分布式实时计算技术等,其中,前三个界定技术基本都是抓取用户的搜索、阅读、观看等行为,语言是最主要的记录载体。此外,《目录》禁止限制机器翻译系统等中译外翻译技术出口,就是要牢牢掌握汉外语机器翻译这个重器,确保我国领先的中译外机器翻译技术始终服务于中国的发展战略和发展利益。准确、高效和及时地传播中国声音、中国主张、中国成就,体现了维护语言技术和信息技术使用有序、规范和安全的国家意志。
《目录》不久将正式公布和实施,建议有关部门尽快制定语言信息技术安全标准,消除语言信息技术安全隐患,完善相关法律法规,确保语言信息技术安全有法可依。语言信息技术安全管理部门需要做好信息安全咨询与风险评估,出台抵御信息安全风险的措施,特别是做好语言信息技术的应急响应机制。此外,开展语言信息安全技术培训,储备相关专业人才,为信息安全提供有效保障,为国家语言信息安全平台建设提供智力支持。从语言信息安全管理入手,统一谋划,统一部署,统一推进,统一实施,完善体制、机制和法制环境,促进语言服务产业沿着健康、安全和可持续的轨道不断发展。
(本文为国家语委2020年度重大项目“新时代中国特色语言管理理论建构研究”[ZDA135-16]的相关成果)
(作者单位:北京语言大学国际语言服务研究院/国家语言服务出口基地)
王立非 林旭
推广
凡本网注明 “来源:XXX(非本网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
上一篇: 喜讯 | 2022“科创中国”榜单重磅发布,人大金仓荣登先导技术榜