百度的翻译日常生活提高了40%:这项技术已经沉淀了十年,而且爆发的正是时候
浏览:190 时间:2023-5-12

百度的翻译日常生活迎来了新一轮的逆势增长:2020年,Q1的日常生活比上一季度增长了10%,比去年的Q1增长了40%,这仍然是在行业整体增长放缓的前提下。同时,百度翻译可以支持200种语言和近4万个翻译方向。每天,全世界要求翻译的字符数超过1000亿,相当于2000本大英百科全书,平均每秒钟超过100万个字符。我们可以把百度翻译日常活动的增加归因于疫情的宣传。一方面,学生在家和网上学习,有更多的时间通过手机和电脑使用百度翻译(K12学生在校学习期间不能使用手机);另一方面,在疫情背景下,跨语言交流变得更加重要,跨语言信息共享变得迫切。百度翻译正好满足了突然而集中的市场需求。当然,这并不是百度的版面翻译方向在过去十年中能够持续增长的全部。除了翻译,百度翻译还隐藏了更多的“秘密”。一个好的翻译产品永远不会只是“准确地翻译”。在过去,“准确性”是判断一个翻译产品是否优秀的唯一标准,所以所有的翻译产品都为准确性而大惊小怪,而来自不同维度的“成就”则显示了它们在这方面的强大。然而,事实上,随着越来越多的人工智能技术被集成到翻译产品中,他们的经验的评价维度变得多样化。首先,就翻译的广度和速度而言,我们应该不断拓展和突破。前者不应局限于主流语言的相互交流,而应在更广的范围内寻求多种语言的翻译,实现真正意义上的“与世界的对话”;后者的最高水平是同声传译。每个人都知道真相,但只有当我们做到这一点时,我们才知道为什么不是每个家庭都有这两种能力。原因是太难了。翻译广度涉及少数民族语言的培训资源。世界上有5000多种语言,其中一半的语言使用者不到10000人。少数民族语言的大部分训练数据只有数万甚至数千,这使得翻译的门槛难以逾越。翻译速度涉及到时间延迟和翻译质量之间的平衡问题,导致许多翻译产品的同声传译体验不尽如人意。通过多语种翻译技术等模式创新,百度翻译提出了基于多任务学习的翻译模型和多智能体联合学习模型,使多种语言能够共享模型表示,再通过反向翻译技术增强数据,使翻译语言在一个季度内扩展了近7倍,目前支持200种。