2018年5月16日,在主题为“匠芯·致物”的发布会上,云知声发布了第一代UniOne物联网AI芯片及其解决方案——雨燕(Swift)。该芯片由云知声自主研发设计,采用云知声自主研发的AI指令集,拥有具备自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超过50倍。
明确物联网AI芯片为发展方向
云知声创始人CEO黄伟指出:“在AIoT(AI+IoT)市场加速爆发的今天,云端方案在网络、带宽、能耗、隐私以及边缘计算等方面的限制使面向物联网的AI芯片成为必然选择。无论CPU还是GPU、FPGA,现有的芯片架构并非为AI芯片专门设计,不能满足物联网AI芯片运算力的需求,并且由于考虑了太多的向后兼容性,在性能上远非最优。“基于业务方面对芯片、场景的反复验证,以及对AIoT未来发展前景的判断,云知声在2014年就明确必须自主研发面向物联网的AI芯片。”
黄伟表示,相较于传统芯片,定制化的AI芯片由于应用场景和AI算法相对确定,因此在硬件设计上更加专业化,在面向此类任务时其相对于通用芯片在计算密度及功耗上有绝对优势。因此,相较通用芯片而言,AI芯片可以在更低的主频、更小的芯片面积条件下,完成机器学习中同等任务量的计算,做到成本、功耗、运算力等多维需求之间的完美平衡。
在推出AI芯片之前,云知声已在智能家居、智能音箱、儿童机器人等市场方面有所布局,基于通用芯片方案(IVM)百万级出货量的产品形态,验证了芯片市场、产品和用户场景的合理性。第一代UniOne物联网AI芯片雨燕量产后,云知声不但能快速切入市场,而且可以满足客户更多产品种类和形态上对成本、稳定性、集成度等方面的需求。”
性能提升50倍的“雨燕”
据了解,云知声第一代UniOne物联网AI芯片及解决方案——雨燕,采用CPU+uDSP+DeepNet架构,支持8bit/16bit向量、矩阵运算,基于深度学习网络架构,可将面向语音AI芯片的并行运算性能发挥到极致,在更低成本和功耗下实现更高的运算力。
在架构灵活性方面,雨燕通过Scratch-Pad将主控CPU与AI加速器内部RAM相连,可提供高效的CPU与AI加速器之间的数据通道,便于CPU对AI加速器运算结果进行二次处理。另外,连接各个运算单元的可编程互联矩阵架构,提供了扩展运算指令的功能,从而进一步提升硬件架构的灵活性及可扩展性。同时,芯片采用多级多模式唤醒,从能量检测,到人类声音检测,再到唤醒词检测,针对语音设备及使用场景的定制化PowerDomain等技术,可将芯片功耗降至最低。
云知声联合创始人/芯片负责人李霄寒表示,云知声不仅提供雨燕芯片和终端引擎,还将应用部分向客户开源,同时提供相应的定制化工具以及云端AI能力服务。通过云端芯结合,云知声基于雨燕提供的是面向一个个具体场景,如智能家居、智能音箱、智能车载等的Turn-key解决方案。基于雨燕方案,云知声可让客户站在更高的设计起点,以更低的成本,在更短的时间内打造出更稳定可靠的产品。同时,开源的方案也可确保客户基于已提供的AI能力自行设计其他各种长尾产品形态,构建起更为丰富的AIoT生态。
“UniOne不是一颗芯片,而是一系列芯片,他代表了云知声对于物联网AI芯片发展战略的整体构想。”李霄寒指出,面向方案商与开发者,UniOne可提供完整的语音AI应用参考方案、云端能力以及定制化工具,可以帮助客户在跨形态的物联网硬件产品上以最低的时间、资源等探索成本,打造最高体验的用户入口。
值得一提的是,在全栈式AI技术能力的积累上,从2012年开始,云知声提出了算法平台化,建立了一套“金字塔”技术研发体系,有ASR、TTS、NLU等应用层技术输出,也有相当于高速上的“兰博基尼”的Atals分布式机器学习并行计算平台,构建了异构化硬件服务集群DeepFlow。而在应用场景方面,云知声在家居、智能音箱、儿童陪伴机器人市场等领域都有布局,验证了市场、产品、用户场景的合理性。