有道AI硬件晋级为,办公三大化解方案

网易高级副总裁、网易有道CEO周枫指出,智能硬件是互联网面向消费新场景的设备延伸,有道智云则是面向合作伙伴的整合优化服务,强化这两部分能够使有道AI产品矩阵的布局和扩充更为稳健。

2018年9月6日下午,网易有道在京举办了“2018网易有道AI开放日暨智能翻译硬件二代发布会”,与业内开发者、合作伙伴和媒体记者齐聚一堂,就有道AI技术及开放赋能进行了深入交流,并现场发布了一款重磅AI硬件新产品:有道翻译王2.0Pro。

2007年12月网易上线有道词典PC版,将词典软件带入互联网时代;2008年8月推出自主研发的机器翻译引擎有道翻译,采用SMT统计翻译技术;2009年1月,网易上线有道词典手机版;2012年11月,推出有道翻译官;2013年的3月,有道词典用户突破3亿;2015年4月,有道词典用户量破了5亿,年底破7亿;2016年3月,推出有道词典海外版本U—Dictionary;2017年4月,有道神经网络翻译YNMT上线,使得过去一年网易在翻译技术上的进步,超过了过去十年的总和;2017年的10月,推出了有道的第一款智能硬件产品——有道翻译蛋,正式进入硬件领域。据介绍,翻译蛋目前销售量已经超过10万。

  北京商报讯 (记者
魏蔚)网易有道近日推出智能翻译硬件二代产品有道翻译王2.0
Pro,而上一代产品有道翻译蛋2017年10月上线以来的累计销售超10万台。产品升级换代后,翻译王不仅增设了英日韩三大常用外语与中文的离线互译功能,在线语音互译的语言包也拓展为43种,覆盖191个国家和地区。同时,翻译王结合了OCR识别技术,支持7种语言离线拍照翻译、21种语言在线拍照翻译,是目前市面上拍照翻译支持语种最多的翻译机。

图片 1网易有道副总裁刘韧磊发布智能翻译硬件二代

第二个技术,基于OCR的图像翻译方案。OCR技术是指在照片里面来找到文字区域,同时把文字识别出来,这个技术可以和翻译技术一起来用,也可以作为一个独立的技术用在其他场合,比如文档的电子化。

有道AI团队分享了有道智云的“AI+三大行业解决方案”,以帮助教育、政企、硬件厂商三大行业解决痛点问题,目前已实现了包括文字识别(OCR)、语音识别(ASR)、语音合成(TTS)、神经网络翻译(NMT)在内四大核心技术手段。

作为此次AI开放日的亮点,有道全新智能翻译硬件二代-有道翻译王2.0Pro亮相。网易有道副总裁刘韧磊现场揭晓了此款融合了有道最新AI翻译技术和匠心设计的智能翻译硬件,与一代产品有道翻译蛋相比,翻译王的优势突出,不仅增设了英日韩三大常用外语与中文的离线互译功能,在线语音互译的语言包也拓展为43种,覆盖191个国家和地区。同时,翻译王结合了OCR识别技术,支持7种语言离线拍照翻译、21种语言在线拍照翻译,是目前市面上拍照翻译支持语种最多的翻译机。

9月6日下午,网易有道在北京举办“2018网易有道AI开放日暨智能翻译硬件二代发布会”,向媒开发者、合作伙伴、媒体记者介绍了网易有道AI战略和AI核心能力、有道智云在教育/办公/智能硬件三大行业解决方案,同时还发布AI硬件新产品:有道翻译王2.0
Pro。

原标题:有道AI硬件升级为“翻译王”

随后,有道AI团队还分享了基于有道整体技术输出平台——有道智云的“AI+三大行业解决方案”,以帮助教育、政企、硬件厂商三大行业解决痛点问题,其中很多技术更是首次向行业展示。目前,有道智云已实现了包括文字识别(OCR)、语音识别(ASR)、语音合成(TTS)、神经网络翻译(NMT)在内的处于业界领先的四大核心技术手段。其中OCR技术当中全自动多语言混合识别、横竖斜排版面自动识别,可以轻松应对多种复杂场景的拍照翻译,在国内尚属首家。多语音识别和语音合成技术也在此次AI开放日亮相,只需提供10分钟的录音,有道语音合成技术(TTS)就能模拟出原声,合成效果与原声真假难辨,令人眼前一亮。另外,有道AI的终端侧离线技术亦有重大进步,离线神经网络翻译、离线语音识别和离线文字识别三大技术更是率先在此次推出的有道翻译王2.0Pro产品中率先应用,并通过智云平台同步开放给业内开发者。

OCR识别技术的难点在于一些复杂的场景,例如图像角度倾斜、手写识别、混合多语种等,目前有道OCR技术能处理19种语言。

责任编辑:

网易有道与AI的渊源要追溯到2008年上线有道翻译,此后一直深耕于AI领域的技术和应用落地,至今已有10年历史。网易高级副总裁、网易有道CEO周枫在开场致辞中指出,新十年的红利将是人工智能技术,金融科技和物联网(IoT)。谈及有道的AI布局,周枫认为智能硬件是互联网面向消费新场景的设备延伸,有道智云则是面向合作伙伴的整合优化服务,强化这两部分能够使有道AI产品矩阵的布局和扩充更为稳健。

段亦涛告诉雷锋网,网易语音团队成立才一年多,去年推出有道智云时还没有语音能力。有道成立语音团队,自己做语音的原因是因为,,虽然现在市面上可以买到语音技术,但是却买不到离线语音技术,教育、翻译这样的终端产品需要离线技术,“没有离线技术是会被别人卡脖子的”,因此有道就投入了语音这块。

作者:魏蔚返回搜狐,查看更多

发布会上同时公布了上一代有道翻译蛋从去年10月上线以来的销量,累计销售超10万台,并在京东和严选两大电商平台上收获了用户一致的满意口碑。

图片 2

本文属于原创文章,如若转载,请注明来源:网易有道AI开放日聚焦人工智能
发布“翻译王”

今年的AI开放日活动,有道智云新增了语音识别、语音合成、对话系统等AI能力;有道智云提出了智能硬件、办公、教育三大场景解决方案;有道还发布了新一代翻译机——有道翻译王2.0
Pro。

通过本次AI开放日,网易有道以行业前瞻的视角梳理了AI技术及应用的落地场景,着重强调了有道AI在教育领域、硬件厂商及办公方向的布局和能力。作为中国AI技术实践的先驱者之一,网易有道也将实现各项业务“AI+”的转变,以更优质的AI技术服务合作伙伴及消费者,营造一个AI技术驱动优化的新生态。

图片 3

图片 4网易有道CEO周枫开场致辞

网易高级副总裁、网易有道CEO周枫在开场致辞中指出,新十年的红利将是人工智能技术,金融科技和物联网(IoT)。谈及有道的AI布局,周枫认为智能硬件是互联网面向消费新场景的设备延伸,有道智云则是面向合作伙伴的整合优化服务,强化这两部分能够使有道AI产品矩阵的布局和扩充更为稳健。

图片 5网易有道首席科学家段亦涛现场展示有道AI过去一年取得的成果

段亦涛也谈到,“语音识别是一个例子,我们语音识别起步比较晚,但是我们很快就追上来。像刚才那几个例子,包括作文批改,这里面很多东西真的要说透的话,它依赖于很多自然语音处理的积累,比如我们做作文批改项目时候,我们大量应用到我们翻译技术,这里面有翻译模型在里面。我们会在了解清楚问题本质后,把这些问题拆解成我们现有技术可以解决的方式。很多事情还是看积累是不是足够深厚,是不是对这个问题有比较好的理解。”

比如说搜题,搜题用到的是OCR技术,传统的文字识别部分是比较拼凑型的,他做的是找类似项而不是真的把里面东西认出来,那我们现在发现,我们钻研之后能够实际做真正意义的识别,这里面一个典型例子就是公式,我们发现国内几乎没有厂商做公式识别,后来找到评估之后发现根本不能用,后来我们自己解决了公式识别的问题。”

网易AR在网易AI战略中占据很重要的地位,与网易游戏、电商的发展紧密联系;以翻译为核心的网易有道在语音识别、NLP方向则有天然的基因。

图片 6

这些能力都以高级API的形式存在于有道智云上,开发者可以只花几分钟时间就将这些能力集成到自己的应用中。目前,已经有多家手机厂商与有道智云合作,使用了这些解决方案,包括OPPO,华为、小米、三星、360等。

小结

有道核心AI能力

整个链条除了OCR还有别的技术,在文字识别后,还需要对图像中的文字进行组行、组段,乃至于组篇章,从语义、语言的角度组织起来,然后再传送到翻译引擎里进行翻译。最后,还会根据原图的排版,对翻译结果进行排版和渲染。

接下来,有道AI技术总监黄瑾分享了有道智云在办公场景下的解决方案。首先是文档翻译,通过OCR技术,有道能识别文档结构、图片、表格、公式,10页4000词的英文论文PDF,1分钟内就能完成翻译。第二个是文档数字化,有道提供了一键导入图片、自动识别、文本审校、语义理解、文档终校等支持,实现中文标准印刷体99.9%识别率。

网易有道近年来在教育领域发展很好,AI技术的加持也进一步加快其步伐。网易有道是目前国内用户量最大的互联网教育品牌之一,服务中国互联网8亿用户,
有道词典用户在2018年初刚刚突破7亿大关。旗下拥有包括网易有道词典、有道精品课、有道翻译官、有道云笔记等大众教育的工具类和在线学习类产品。

目前,神经网络翻译、OCR、语音技术等都已经通过有道智云开放给合作伙伴,在有道智云上线一年后,机器翻译服务了超过700亿字符的请求,我们OCR服务的120亿的次数请求,开发者数量达到4万。

相关文章