声网:硬核技术赋能在线教育,站在实时音视频领域C位

作者:林丹  2019-07-20 12:25:45

作者 | 林丹

出品 | 创业最前线

在美国的哈佛大学,一位教授上课的场景被高清摄像机捕捉,该画面先经过编码器压缩,再以分段发送的形式,通过互联网传输到位于中国大陆的学生电脑上,最后由播放器进行实时解压缩——就这样跨越了时空的限制,学生轻松地学到了最前沿的知识。

“让人毫无障碍地学习全球先进知识”这件事,在十多年前或许还是人们的一种设想。而今,随着科技的发展,众多在线教育平台可以通过远程线上教学,利用实时通信技术,将全球各地的优质师资和生动课堂送到学生面前,并且通过机器教学及老师现场授课,实现“千人千面”的教学体验。

能让以上这一切成为现实的,就是作为底层支撑技术的实时音视频技术。

据了解,在线教育平台均以音频和视频为教学载体,随着互联网技术和用户需求的迭代发展,当在线教育的场景变成实时音视频通信时(即以视频直播方式为主的教学方式),背后的技术就不止复杂了一倍。


在实时音视频通信中,由于双向的反馈,因此对稳定性和延迟的要求变得非常高,回声处理成了新难题,而网络问题则一直是技术难点。检测网络带宽,以平衡视频质量和传输速度的带宽探测、处理丢包、抖动等,这一切都要求技术团队有很深厚的技术积累。

不过,在声网这支精锐的团队面前,这些问题一一迎刃而解。

硬核实力派:声网站在实时音视频的C位

早在实时音视频技术普及之前,声网的创始人兼CEO赵斌就已经预见其巨大的势能。

作为实时通信领域的领军人物,赵斌曾担任YY(欢聚时代)的首席技术官和WebEx的创始工程师,为了建立一种大众化的现代通信模式,他在2014年创立了声网,提供实时通信云服务,开发者只要轻松使用声网的SDK,就能实现App里的音视频通话和互动连麦直播功能。

2015年,随着4G和智能手机的普及,移动直播成为了新的风口。

声网团队比其他同行更敏锐地抓住了时代发展的脉络,不仅见证了在线教育3.0(直播课模式)和3.0+(互动直播课模式)的发展,还为在线教育企业精心研发了一套在线互动课堂解决方案。

当时,他们洞察到,从传统的线下教育到新兴的在线教育,用户想要“更有效地学习”这一需求未曾改变,但教育的形式、网络环境、硬件设备等都在发生变化。

例如,在不同时空进行实时教育的过程中,技术供应商既要解决Wi-Fi和移动网络的切换问题,又要保证音质、视频流畅以及光线平衡——决定在线教育平台的稳定性、清晰度、对话连麦的实时性和沟通的顺畅程度的种种秘诀,尽在于此。

面对复杂的在线环境对实时音视频技术提出的新挑战,声网团队投入数年研发,针对不同的场景和环境进行技术优化。

上周,声网Agora在线教育行业产品总监仇媛媛和首席音视频RTC专家陈功,在“实时音视频解决方案”的媒体沟通会上,为众人揭晓了如今声网的硬核实力。

据声网在线教育行业产品总监仇媛媛透露,声网已经拥有了一整套在线互动课堂的技术解决方案。

在网络传输层,声网自建了SD-RTN™,实现全球网络覆盖,既为在线教育企业减轻基础建设的高额成本,又保证了全球范围内实时音视频的稳定传输;其次,声网通过自研和生态,提供PAAS层能力,包括实时音视频、实时消息、实时录制和云录制,白板,口语测评、情绪识别、美颜等AI相关能力;最后,声网通过生态覆盖,提供SAAS层能力。

与此同时,这套在线互动课堂解决方案全面支持1v1、小班课、互动大班课、双师课堂等四个在线教育里的基础场景,为企业提供更稳定、更高质量、更低延时、更强互动的实时课堂,让教学体验超越线下授课场景。

“实时”意味着在线教育的1对1和1对N的场景中,老师和学生需要同时看到对方的反应,因此音视频技术的核心在于“低延时”,学生跟老师之间的沟通延迟最好在300毫秒以内。

如果延时很高,通讯就变得卡顿,导致学生的学习体验很糟糕,而声网的实时音视频技术解决方案能让老师说完一句话,学生马上就能反馈,真正实现了延时低、无卡顿与画面清晰。

众多企业“慧眼识珠”,纷纷看中了声网这套在线互动课堂解决方案,目前已有数十家业内知名合作伙伴在持续使用声网的解决方案,包括新东方、好未来、VIPKID、沪江CCTALK、作业帮、一起学等。

“有了声网的技术加持后,这些在线教育平台能让学生即使身处偏远地区的弱网环境中,也可以保证实时音视频的传输体验,丝毫不卡顿,线上课程画面声音清晰流畅,教学质量提高。据我所知,学生和家长的满意度都很高。”
一位熟悉在线教育行业的投资人告诉「创业最前线」。

事实上,从上周的沟通会也不难看出,声网对互联网教育有独立的业务支持部门,因此能够针对教育行业的实时场景不断技术迭代与完善服务,这是国内其他服务商所不具备的,也是众多知名在线教育企业不约而同地选择声网的主要因素之一。

除了做到“延时低”,“稳定性”是声网最受赞誉的一个技术特点。

声网的重要合作伙伴之一松鼠AI的技术负责人曾公开表示:“我们前后比较了超过10家云直播的服务商,发现声网的音视频信号更稳定;即使在弱网环境下,也能优先确保语音的传输比较顺畅,基本不影响上课体验,这样的稳定性是我们尤其看重的。”

这种稳定性来自于声网“硬核”的技术能力和技术迭代精神,细数近几年来,国内外不少云服务公司都曾出现过大面积宕机的情况,但是声网从未出现宕机,让业内对这个成立仅5年的公司刮目相看。

如今,声网拥有国际领先的实时音视频引擎技术,已经成为全球最大的实时互动技术服务商,无异于站在实时音视频领域的C位,“硬核实力派”的称誉可谓是实至名归。

未来变革者:把世界装进声网

毫无疑问,声网的技术正广泛地应用于在线教育领域。

各大平台使用声网的在线教育解决方案,能实现一人上课、多助教协作,完全实时模拟面对面沟通效果,真正做到多地多教室同步上课,让在线教学效果有实质性的提高。

而放眼全球,教育是一个前景无量的市场,从传播技术、课堂互动方式、延伸服务等方面都存在巨大的机遇。

当前,声网为全球超过10万开发者提供年数千亿分钟实时音视频通信云服务,并且服务客户的“包围圈”从Startup、独角兽和巨头,越来越多企业都在使用声网的服务,如联想、携程、小米、美团、陌陌、好未来、新东方、VIPKID等人人耳熟能详的企业。

因此,基于声网的技术实力和服务客户的潜力,我们有理由相信,声网将极有可能成为未来实时音视频领域的变革者。

作为变革者,声网在技术迭代和产品设计的每一个细节里都“植入了创新基因”。

首先,在技术创新上,声网Agora首席音视频RTC专家陈功在沟通会上表示,声网通过自建的全球虚拟实时通信网络SD-RTN™、自主研发的音视频编解码器和网络传输策略等独家技术手段,做到在实时音视频过程中异常网络波动自适应、60%抗丢包、AI降噪、网内传输接近专线质量等领先技术水平。

其次,声网给在线教育创新提供了4大应用场景:游戏化教学、在线音乐教学、AI互动课堂、超级小班课,为实时在线互动课堂提供更丰富、多元的教学体验,实现规模经济与个性化的平衡。目前,这些应用场景已完美搭载于VIPKID、好未来、一起作业等在线教育平台上。

最后,AI互动课堂方案也充满了特色——声网采用全真虚拟动画结合教学知识点的虚拟课堂,沉浸式教学让孩子身临其境,同时采用智能识别语音技术,将AI运用到练习与测评场景中,给予孩子反馈和奖励,促进孩子的学习热情。

更值得一提的是,声网首次公开发布将深度学习应用在音频降噪方面,基于深度神经网络模型,能够在不额外增加任何硬件的基础上,实时将人声与噪声分离,有效抑制环境中的各种噪音,保证上课体验。

究根问底,声网之所以能为在线教育提供场景化教学的全新体验,皆因公司拥有强大的技术研发团队,积累了多年领域研发经验,兼具创新精神和丰富的行业经验,才能让系统在低网速、高并发下稳健运行,并实现实时互动、一站式服务、SDK定制化、高清流畅、数据分析等产品功能。

如今,在线互动场景中,声网是行业内首家能将低延时方案应用到百万人数大频道的技术服务商,加之各种技术迭代与创新举措让它成为行业内的领跑者与变革者,未来将有绝对实力推动行业快速发展。

结语

当我们在展望未来时,未来已经变成了现在。

科技行业永远是进步最快的领域,根据工信部和三大运营商的规划,2020年,中国5G将正式商用,和4G相比,5G会是一种质变,将进一步推动实时音视频技术持续演进。

作为实时音视频领域的专家,声网不会止步于当前的状态,除了在在线教育行业继续深耕,还要迈向更广阔的未来——声网将把业务扩展到各个行业,如在社交娱乐、远程医疗、互动游戏等领域开疆拓土,为用户持续提供近乎完美的视听体验。

在5G时代,声网或许会更进一步地连接每一位名师、每一个学生、每一间教室、每一家企业,让传与受跨越时空的阻隔,让音视频服务跟随着智能终端深入到互联网生活的每一个环节,深刻地改变人们互动沟通的方式。