商品与质量周刊
品牌对话
当前位置:商品与质量周刊 > 品牌对话 > 正文

对话网易有道CEO周枫:AI硬件如何撕开教育新入口?

2019-08-13 23:32  商品与质量周刊

智东西(公众号:zhidxcom)

文 | 司北

最近的AI学习硬件市场十分热闹。前有AI编程教育机器人公司优必选被曝正筹备A股上市,后有小米、学而思陆续进军。就在上周,网易有道也推出了新款AI学习硬件——网易有道词典笔2.0。

在过去两年间,有道已经陆续打造了8款AI学习硬件产品,除了两代词典笔之外,还有有道智能笔、有道云笔、有道翻译王等等。不知不觉间,这个以“有道词典”而广为人知的教育科技公司,已经深入AI学习硬件腹地,打下了一片江山。

对话网易有道CEO周枫:AI硬件如何撕开教育新入口?

▲网易有道CEO周枫

近期,智东西与网易有道CEO周枫进行了一场深入对话,周枫不仅与我们分享了有道在打造词典笔2.0背后的种种故事,还回答了有道为什么要做AI学习硬件?有道打算怎么做AI学习硬件?

一、AI教育市场兴盛,巨头涌入

AI+教育赛道越来越火了——据CNNIC数据预测,到2020年,AI+教育市场规模将飙升至3000亿,增速惊人。教育部部长陈宝生也在今年5月时表示,中国正在组织研制《中国智能教育发展方案》,以推动人工智能创新成果在教育领域的转移转化。

而在AI+教育的众多细分市场里,AI学习硬件成为了一个被众人看好的新风口。

今年5月,AI编程教育机器人独角兽优必选被曝筹备A股上市,CEO周剑预计公司2019年销售额将达60-80亿元;

6月初,小米推出了“小爱老师”AI英语学习机——这是小米联合创始人王川继小爱音箱后主导操刀的第二款重磅AI硬件——也宣告小米正式入局AI学习硬件市场;

6月底,好未来旗下学而思网校召开发布会,推出儿童智能编程套件……而更早之前,科大讯飞、步步高等玩家也陆续切入,市场好不热闹。

教育是一个传统、封闭的学习场景,对于智能手机有着天然的抗拒。由于太容易造成干扰,很多学校甚至不准学生带手机入校。在智能手机被迫“退场”后,空出来的真空地带就是专用AI学习硬件的用武之地。

学生对于智能学习工具的需求从未停止。早在九十年代末期,以电子词典为首的学习硬件已然风靡一时。根据蓝象资本从供应链处得到的数据,当前,以儿童电话手表为主的学生可穿戴设备年出货量可达1800万台、智能机器人/故事机的年销量约为1200万台、AI翻译机的年出货量约几百万台、点读笔与学生平板的出货量都分别达到了300万台/年——它们都在快速增长中。

在这其中,每一款AI硬件都对应着一项痛点明确的使用场景。

拿英语来说,这一科目有一个非常明确的用户痛点——查词翻译。每个学英语的人一定会阅读、一定会背单词、因此也一定需要查单词。查词是一个非常痛苦的过程,学过英语的人想必都深有体会,它不仅会打断学习流程,还非常耗时耗神。遇到生词多的时候,常常是阅读10分钟、查词半小时。

▲有道词典笔2.0使用效果现场展示

周枫说,网易有道之所以推出AI词典笔,正是因为在观察学生学习英语的过程中,发现了这一个日常的痛点。有道词典笔2.0是一款主打英语查词尤其是K12教育场景的智能学习硬件,可以让学生用词典笔“一扫即查”,在词典笔屏幕上实现单词/词组/句子的中英双语查词。

这款产品去年推出了第一代,今年升级为词典笔2.0,不仅增加了离线的整句神经网路翻译等功能,还大幅提高了查词速度——学生用词典笔2.0一分钟可以查60个词,用电子词典一分钟只可以查询12个,纸质词典一分钟只能查4个。

对话网易有道CEO周枫:AI硬件如何撕开教育新入口?

▲有道词典笔2.0

这并不是一个非常宏大的场景,却是一个非常明确的、可用工具解决、提高用户体验的学习痛点。

说到这里时周枫有些感慨,他说,学习是个很辛苦的过程,有道之所以推出在线课程、AI学习硬件,本质上都是为了通过科技让学生们的学习更有效、更轻松、更个性化一点。

今年上半年,在有道词典笔1.0发布的10个月后,其销量突破了10万台。而在词典笔2.0的发布会现场,周枫则定下了另一个更为宏伟的目标——“中国的中小学生人手一支词典笔”。而周枫在发布会上没有明说的数据是,当前国内中小学生约有2亿人。

二、两年磨一剑

周枫说,词典笔2.0跟网易系的其他产品一样,共享着网易的两大核心特质——匠心、创新。

对话网易有道CEO周枫:AI硬件如何撕开教育新入口?

其实早在有道词典笔1.0尚未面世之前,词典笔2.0的项目已经开始推进了,有道花了将近一年半的时间来打磨这款产品,从芯片架构到笔尖摄像头、从OCR到神经网络翻译,把软硬件的“雷”都排一遍之后,才在今年8月正式拿出了这款产品。

拿芯片来说。市面上的英语词典笔的产品形态最早源自于日本厂商,但是早年间由于终端侧芯片的算力限制,产品体验并不好——查不准、查不快。

但是,随着智能硬件供应链的逐步成熟、新技术的不断涌现,以深圳华强北为代表的一大批终端产业链玩家应声崛起,周枫说,当前词典笔的计算能力已经能达到传统产品的100倍——甚至更多——用户体验的效果提升非常明显。

这一代词典笔2.0采用了Arm架构芯片,有道技术总监林辉在发布会上表示,为了让词典笔2.0实现离线翻译功能,有道AI团队花了很大力气将神经网络翻译模型大幅压缩、裁剪,并和外部芯片团队一起做了很多工作,才让AI流畅地跑在终端侧上。

拥有了离线翻译功能后,学生将不需要联网使用,非常适合学校这种无网络环境。

另一个值得关注的点在于笔尖摄像头与OCR技术的升级。OCR是光学字符识别,这项技术要做成不难,但是要做好很难,尤其是在词典笔这种应用场景中——用户在用词典笔划取词句的过程中,常常会出现手抖、快速滑动、左右滑动、背景复杂等实用难点,有道的AI团队同样花了很多功夫在AI软件上的打磨,研发了自适应全景拼接技术与流式识别计算,终于能够把整句翻译、复杂背景下文字识别等以前难以实现的功能做好。

然而,有道团队在产品研发的过程中,也遇到了无法纯靠软件解决的问题——比如,词典笔笔头摄像头帧率过低。

帧率又称FPS(Frames per Second),中文翻译为每秒显示帧数,通俗来讲就是“一秒钟连续展现的画面数量”。词典笔2.0在笔头处有一小摄像头,将用户扫描的内容一张张拍下来,再通过OCR技术进行拼接与识别。

对话网易有道CEO周枫:AI硬件如何撕开教育新入口?

普通摄像头帧率一般只有30fps或者60fps,当用户划快了、相机拍摄速度跟不上,就会让拼接出来的文字出现断层,导致翻译错误。

因此,周枫一咬牙,在词典笔2.0里用上了帧率高达200fps的高帧率摄像头,再配合软件团队的OCR技术升级,让有道词典笔2.0的识别准确度可以达到95.5%,高于业内的82%。

除了芯片、摄像头之外,铝制机身与Wi-Fi信号遮挡的矛盾、触摸屏与模具边框的矛盾等等,都是有道在这一年半时间里一个个解决的问题。

硬件决定了软件性能的天花板——这是每一个下海做硬件的互联网巨头都踩过的“坑”。