产品
没有界限的语言多远? Shi Wei,时空锅的首席技术
当今最大的技术挑战是在3秒内考虑延迟和质量翻译的低点。随着全球化的加深,对跨语言信息传播的奉献的需求正在以前所未有的速度增长。从跨国业务的云会议到全球学术合作,对实时语言转换为各种方案的需求促进了实时翻译技术,在人工智能领域取得了重要的成功。根据中国翻译协会的“人工智能和翻译报告”,AI翻译技术已从实验室转变为大规模的商业用途,并广泛用于跨境贸易,文化交流,教育和医疗服务以及其他领域。在平光2024中,“机械翻译”或“人工智能翻译”的数量增加到1,545。 AI翻译技术促进了多模式场景的整合,诸如翻译耳机之类的智能翻译设备有助于它们的出现。翻译耳机中最大的瓶颈在于实时翻译的速度和准确性。用户对AI翻译设备的期望更高,完美的状态将“说话和翻译”,并且延迟在1秒内得到控制。它要求翻译的语义连贯性和准确性可确保潜伏得非常低。时空技术有限公司的首席技术官Shi Wei在Weasan Weekly的记者接受采访时,这是3秒钟内考虑到低潜伏期和高质量翻译的程度,这是目前最大的技术挑战。深圳时空时空技术有限公司(因此从因此称为“太空和太空锅”)于2016年成立。它着重于整合人工智能技术和硬件,以开发破坏语言障碍的AI翻译产品。据报道,它的产品有在全球171个国家和地区出售,占全球73.39%的股份,该地区有超过200,000个用户和4300多个客户。自我开发的型号每周大约有一半的时间:当前支持的时空翻译耳机有几种语言? Shi Wei:目前,我们正在支持在线41种语言的翻译,并且我们有一个专门的团队继续扩大语言支持。作为产品和服务提供商,我们没有自我开发的模型,但会发现并适应世界上最好的语言模型。例如,一些本地化语言(例如泰语或日语)对于Google和Microsoft等大型公司来说可能还不够好。我们将开发自己或优化这些语言的模型。对于不符合我们标准的语言,即使竞争对手声称支持100多种语言,我们也不会上网,因为用户体验已经之前。目前,我们建议RT 93口音,尤其是具有许多口音的语言,例如英语。在离线方面,新的“新T1”产品支持11种语言和31种语言,所有这些都基于自我开发的模型,并且不依赖第三方。每周时间:使用由自我和第三方模型开发的Modselo的比率的估计情况是什么? Shi Wei:特定比例很难概括,因为它涉及许多链接,例如语音识别(ASR),机器翻译和语音合成(TTS),并且每个帐户约为一半。当前,具有较少的语言识别语言,具有大约5种类型的语言,例如泰语和阿拉伯语。在翻译部分中,我们正在慢慢地从一般的大型模型转变为一个自发开发的模型,而TT通常会实现自我发展。通常,我们越来越多地关注基本技术的独立研究和开发,以优化性能并改善用户体验。每周一周:tIME和太空锅释放Bable OS系统。为什么需要专门为BUMO系统专门使用翻译设备?它扮演的角色是什么? Shi Wei:Bable OS的发布具有三个含义。首先,这个名字的灵感来自圣经中的巴别塔和小说《科学小说》中的巴别夫鱼,这象征着通过追求最终技术来访问和实现我们的愿景的沟通概念。其次,我们提出了“通往巴别义的道路”的概念,就像对自动驾驶的分类一样,在许多阶段都将翻译技术的发展分开,并显示了我们在世界以外的技术道路。第三,我们披露了一些技术体系结构,例如通信全双工双向,减少噪声算法,离线和在线混合模型等,并分享如何开发此类系统。此外,时空锅还计划打开一些简单的约会Modelswhich文本的资源Orts十二语言语言并保持高精度。这不仅是为了促进行业的发展,而且还因为我们从开放的社区资源中受益匪浅,并希望重返该行业和共同。每周一次:大型模型需要大量数据培训,数据来自时空?如何保护用户隐私? Shi Wei:用户隐私是我们非常重要的。我们从一开始就承诺,服务器尚未维护任何用户数据。将来可能会启动用户改进计划,从而允许用户自愿提供脱敏数据,但尚未实施,客户数据也由用户本身管理。培训数据主要来自三个方面:首先,公共渠道,例如由Web爬网获得的数据,在清洁和标签多年后提高了质量;其次,使用大型模型的翻译能力通过区分来生成质量数据大型型号;第三,与全球数据公司或众包机构合作,通过手动标签在人类水平附近生成高质量的数据。这些数据分阶段积累,以确保模型性能的持续改进。核心是每周一次的双向实时解释:与诸如Iflytek之类的竞争对手相比,陶器时间和空间的主要竞争是什么? Shi Wei:与Iflytek的比赛不仅仅是无效的竞争。在早期,主要促进了手持式翻译机,市场主要在中国,因为我们专注于翻译耳机并专注于海外市场。手持式翻译器的互动体验有些复杂,需要单击和运输设备。锅时间和空间耳机已经实现了无缝的双向实时交付,这与与真实人的交流的经验接近。它需要销毁两个主要的技术困难:一个人是完整的沟通,以确保双方都可以随时干扰彼此的讲话,例如自然对话;其他人将通过串扰解决问题,避免另一方干扰认可的另一方的声音。这两个方面是我们从2016年至2017年开发原型到2019年的Kapanahunan的主要突破。尽管目前,市场上的其他AI头戴式耳机以及IFLYTEK也增加了翻译功能,但其中大多数人将无法实现双向实时同时交付。这也是时间和空间锅的主要竞争。每周一次:锅的时间和空间的主要用户是什么?这是会议场景还是旅游,移民,教育等场景? Shi Wei:我们的用户组主要需要长期和众多的跨语言沟通周期,例如商业,医疗,教育和其他行业情景以及移民离子组。北美是我们最大的市场,因为移民国家带来了不同的语言需求。也有狂热的情景,但它们以低频,标准的短句子或问题使用,适用于手持式翻译人员。我们的耳机更适合进行深度的双向长期对话。每周一次:如何在C和B市场中权衡优先级? Shi Wei:目前,我们所有的产品主要用于C,其营销和产品表格针对消费者。尽管我们看到了B市场的潜力,尤其是在商业和行业方案中,但市场还不足以为特定行业提供定制的硬件。我们更倾向于开发适合许多情况下通过不同模型满足不同需求的通用产品。每周一次:陶器计划的时间和空间是开发AI眼镜,还是包括双向实时交付其他品牌AI眼镜中的精神病学?什叶威:我们总是打开一杯AI。 2022年初,我们开始关注AR玻璃行业,并对诸如Thunderbird和Xreal等制造商进行了深厚的技术交流。我们的主要技术是一种实时的双向同时交付,不仅限于耳机硬件表格,但有望适应不同的情况和设备,例如眼镜或颈部安装的设备。但是,使用AI眼镜的背景与耳机不同。这些眼镜更适合接收单向信息,例如收听讲座或观看实时字幕的翻译,而双向交流要求双方都穿着设备,而设备相对较低,这是相对较低的情况。因此,我们将继续探索合作或自我发展。赛道远非成熟。每周:翻译不仅是语言的改变,而且是文化的重建。您如何看待功能和与“上下文”,“音调”,“幽默”甚至“标签单词”交谈时,翻译器耳机的限制? Shi Wei:说实话,目前这一方面并不完美。在实时翻译中,上下文和语气非常困难,尤其是个性化的词汇或行业术语。如果用户可以提前提供演讲,PPS或独家词汇,我们可以通过这些客户的翻译来优化影响。但是幽默或文化等治疗方法取决于进一步的突破模型技术。整个行业尚未达到这个阶段。相反,我希望有一天会担心这些问题,因为这意味着几乎可以解决翻译的实时和准确性。每周一次:您如何看到成熟度和潜在的翻译设备轨道边界? Shi Wei:这首歌远非成熟。下载全球翻译应用程序的数量高达10亿,显示出巨大的需求。我们的硬件针对离线和实时情况的需求和市场空间很大。从技术上讲,我们的自我评价用户是90分,目前我们可以达到80分。因此,该轨道在技术发展或市场空间方面具有很大的潜力,预计Susit的增长将在几年内保持双重增长。每周时间:如果翻译技术足够好,我们仍然需要了解外语吗?您认为“技术取代语言学习”的过程是什么? Shi Wei:有两个需要了解外语的层次。首先是沟通的需求。如果AI翻译技术非常成熟,则需求的这一部分可以大大减少。但是第二个是更深的文化和思维需求。学习语言不仅是一种交流工具。它还可以帮助理解文化,逻辑思维和表达实践。例如,阅读原始论文或英语诗歌可以使您更直接地感觉到它们的含义,这对T很难垃圾被完全替换。因此,对外语研究的需求可能会在将来下降,但不会消失,这将是感兴趣的目标,例如艺术或文学。