当前位置:文档之家› 科大讯飞深度研究报告记录

科大讯飞深度研究报告记录

科大讯飞深度研究报告记录
科大讯飞深度研究报告记录

科大讯飞深度研究报告记录

————————————————————————————————作者:————————————————————————————————日期:

科大讯飞深度研究报告:良工心磨砺,静听春江暖

i投资(微信号:itouzi8)“VIP会员俱乐部”旨在搭建专业的产业链研究社群。通过汇集产业专家、行业分析师、PE/VC、上市公司及实业高管和职业投资人,一起进行深入、全面、前瞻性的产业链研究,发掘股权、股票市场的投资机会。申请加入VIP方法:请加小i个人微信,微信号:itouzi6,加入时请标注:vip+姓名+公司+职位+手机

作者:长城证券周伟佳

投资建议:

在苹果发布SIRI三年后的今天,语音行业愈发成熟,语音应用遍地开花,互联网语音门户的盈利模式逐渐成形。$科大讯飞(SZ002230)$在这3年里,证明了自己的技术实力与市场能力,确立了中文语音门户霸主地位,同时取得了财务增长。在进一步优化了股权结构之后,讯飞将再次起飞。预计公司2014年至2016年EPS为0.55/0.89/1.42元,对应PE51/31/20倍,首次覆盖,强烈推荐。

投资要点:

股权结构合理确保长期增长:近期公司增加科大控股与胡宏伟先生为公

司一致行动人,合计持股达到总股本20.95%,高持股比例确保公司高管有足够动力。公司第二期授予的股票期权的行权价格为29.88元,接近现价,彰显公司信心。

行业门槛不断抬高:语音技术已经脱离了小打小闹的年代,需要大量的资金和人力的投入。讯飞依托中科大的学术实力和人力资源供给,拥有强大的研究团队。同时拥有多项业内唯一的产业资源,如国家863产业化基地、发改委“语音高技术产业化示范工程”、语音技术标准牵头制定单位等,享有“语音技术国家队”的政策待遇。可以说,讯飞将行业门槛提升到一个新的高度。

技术实力一统江湖:公司在中文语音行业积累了十几年,在普通话测评、呼叫中心,及语音云上亿用户中积累了大量的语音数据,对不常用语如专业用语和方言等等识别率逐步提高,难以复制。目前市场上其它中文语音相关公司,很多是讯飞的旁支,也有在讯飞系统上进行二次开发,真正的能与讯飞匹敌的对手,尚未出现。

语音应用遍地开花结果:行业应用上,在电信级语音平台业务具有垄断地位,在教育领域称霸语音教具和口语测评,在国安公安领域承建声纹库和声纹处理服务器。在互联网领域,公司把控了智能电视、OTT、国产智能机、嵌入式软件、车载、可穿戴和智能家居等等软硬件产品的语音入口。

估值略贵但值得拥有:在互联网入口尚未完全产生效益的情况下,公司仅凭现有电信、教育等业务,即可实现50%左右的增长,估值水平会迅速回落。更有互联网创新盈利模式储备,强烈推荐。

1. 合理的股权结构确保最大激励效果

科大讯飞股份有限公司(以下简称“公司”、“讯飞”)于14年11月21日公告权益变动,变动前科大讯飞一致行动人(自然人股东刘庆峰、王仁华、陈涛、吴晓如、徐玉林、江涛、黄海兵、王智国、郭武、严峻、胡郁、张焕杰、吴相会等13人)合计持有股份1.26亿股,占公司总股本比例15.71%,本次权益变动完成后,增加科大控股与胡宏伟先生为公司一致行动人,公司一致行动人合计持有股份1.68亿股,占公司总股本比例20.95%。

公司披露,权益变动完成后的12个月内,根据经营和发展的需要,不排除在未来12个月公司资产及负债作出购买或臵换的可能性。

调整后的结构,平衡了对高管的激励效果和对大股东中移动的回报,并且为后期可能的重组留下充分的想象空间。

公司上市后进行了两次股权激励,两次激励的共同特点是行权价接近停牌前的收盘价。第一次股权激励是在2011年12月,行权价格为40.76元,接近公司当时股价,随后不久,公司就发生重大股权变化:在2012

年8月,公司成为中国移动子公司,参股15%。

最新一期授予的股票期权的行权价格为29.88元/份,授予股票期权总计950万份,约占公司股本总额的1.19%。行权条件是以2013年净利润为基数,2014-2017年的净利润增长率相比2013年分别不低于30%,70%,110%,160%;2014-2017年净资产收益率分别不低于9%。草案公布后一周,公司宣布增加一致行动人。

2. 技术实力领先,确保行业龙头地位

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术的最重大突破是隐马尔科夫模(HMM,Hidden Markov Model)的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。此后严格来说语音识别技术并没有脱离HMM框架,也正是因为HMM的特点(涉及评估、解码、学习三大难题),使得语音识别技术天生便具有三道极高的门槛:足够优秀的算法,足够强大的计算能力,以及足够庞大的数据库支持。公司在这三点上,都拥有着无法撼动的行业优势。

2.1出众的算法技术

优秀的算法于语音识别而言就如一本上乘的武功秘籍,这就是江湖的规则,人家拿着独孤九剑心法,凭你多练十年青城剑法也是打不过。高效而精准的算法是决定一切的关键,因为HMM模型涉及的复杂度是

O(2?T)的量级(N代表状态迁移的可能数,T代表时间节点数),这使得解析语音库的计算量远超过了一般微机所能承受的范畴,优秀的算法能够使得结果迅速收敛,令计算量呈几何式减少。另外在语音识别领域,算法在很大程度上也决定了一个模型所能够达到的最大精度,决定了一家公司最终能够达到的武林地位。

在计算机领域掌握独门算法而横行天下的例子数不胜数,一个十分有名的案例就是上世纪90年代的id Software。在那个微机落后的年代,由id Software出品的第一人称射击类游戏《雷神之锤》第一次实现了跨时代的真3D构图,同时它还第一次利用动态光源(dynamic light sources)替代了以往效果生涩的顶点静态光照(sector-based static

lighting),划时代的游戏画面使得《雷神之锤》一上架便惊艳全场,id Software更是名噪一时。当时的游戏开发者对于公司能够利用落后的微机渲染出真3D效果的实力均感惊诧,直到多年后id Software公开技术时,大家才发现它的秘诀主要在于运用了一个平方根的优化算法(在3D图形编程中,经常要求平方根或平方根的倒数),便实现了看似不可能的任务。

我们从公司历年在NIST语种识别大赛上的获奖状况可以看出,公司掌握的语音算法技术是领先于国内、甚至领先于全球的。NIST语种识别大赛由NIST(美国国家标准技术署)组办,是国际上规模最大、影响力最广泛的语种识别评测。由参赛团队提交系统,在官方统一的硬件下进行测试,是语音识别算法最好的试金石。公司在2008、2010年NIST说话人测评关键指标均保持前两2名,2009,2011年语种识别测试中获8个高混淆度方言对测试冠军,通用测试亚军。

然而从另一方面,优秀的算法却不似武功秘籍一般,可以通过森林探险剧情不慎掉入深谷然后机缘巧合开启先人宝箱得到,语音识别算法必须依靠技术团队长期以来一砖一瓦的堆砌才能成型,算法优化依靠的是科研团队不断的努力和创新。科大讯飞所拥有的强大的“国家队”保证了公司能够在算法方面持续领先市场,这才是公司核心竞争力所在。讯飞和中科大共同组建了“语音及语言信息处理国家工程实验室”,该实验室由国家发改委批复成立,2011年9月27日在中国科大揭牌。实验室依托科大讯飞建设语音及语言技术研究及工程化应用的技术研发平台、设计开发平台、测试验证平台和技术应用重大示范平台,并依托中国科大建设语音合成研究室、语音识别研究室自然语言处理研究室、智能人机语音交互研究室等4个核心技术研究室,进一步整合源头核心技术研究资源并通过工程化平台形成产业界急需的先进科技成果,不断提升智能语音技术与产业的核心竞争力。将在未来2至3年内构建成为我国语音及语言战略性新兴产业发展平台。我们有理由相信,已经赢在了起跑线上的科大讯飞有足够的实力保持甚至扩大其在语音算法上的领先优势。

2.2庞大的数据库与强大的计算能力

空有一本绝世秘籍,若无扎实的内功配合也是枉然。因为语音识别模型的需要经过不断的修正与调整,才能在各种不同的语境、不同的方言中保持出色,这就是我们常说的“学习问题”。完成语音识别系统的学习过程需要庞大的语音数据库支持,在海量的试验中不断修正模型参数,才能达到更高的准确度。

讯飞在中文语音行业积累了十几年,公司在普通话测评、电信级语音识别、语音搜索服务及语音云上亿用户中积累了大量的语音资料,拥有着无匹的海量语音数据库。目前公司的语音识别系统样本库在百万人的规模,而IBM的语音识别系统数据库仅在万人的规模。在这些语音数据库的训练下,科大讯飞语音识别系统对不常用语(如专业用语和方言等)的识别率独具优势。这是实打实的家底,短期难以被复制。

要消化掉庞大的数据库,就必须拥有强大的计算能力,另外,公司所提供语音服务的速度也取决于公司云端的计算能力。目前智能语音技术+云计算的组合,已经成为语音识别技术的主流方案,巨大的财力需求,也构成了语音识别技术的一大门槛。在国内有了庞大的后台数据库模型作支撑,加之公司利用基于云计算的模型,使用超过100个CPU,上百G内存大的系统来训练这个模型,使得公司语音识别系统不断刷新着用户的体验。

云计算破解语音识别难题,同时也增高了进入门槛。在云时代,小打小闹的语音软件供应商,受到财力人力的限制,无法突破,行业将被讯飞、Nuance、百度这样的财大气粗的企业垄断。同时,我们看到,讯飞每年近亿元的补贴收入,也能从侧面证实,语音产业也是资本密集型的!

2.3超脑计划

讯飞超脑计划是要实现基于类人神经网络的认知智能引擎,预期成果是实现世界上第一个中文认知智能计算引擎。目前,讯飞已经集结了在认

知智能领域最强研究团队,将在知识图谱构建与推理、人工神经网络模拟、人脑原理分析模拟几个方向展开研究。讯飞超脑的三大研究方向:1、贴近人脑认知机理的人工神经网络设计,更好的支撑认知智能的实现;

2、实现与人脑神经元复杂度可比的超大人工神经网络(相当于目前感知智能网络规模的1000倍);

3、构建基于连续语义空间分布式表示的知识推理及自学习智能引擎。讯飞已拿到科技部863计划“类人答题”项目,目标是三年之内,使机器能够通过高考,并且达到“一本”水平。让我们拭目以待吧。

3. 语音门户霸主

3.1把握互联网语音门户

目前互联网应用中与语音相关的可以分为两类:

语音门户类:这一类应用可以后向链接到可以产生收入的应用中去,语音在其中扮演了导入者的角色。典型的语音应用就是类似“灵犀”的语音助手。语音助手作为语音门户,可以识别用户应用需求,并向其它相关应用发送请求,从而实现语音门户功能。举例来说,如果客户想查询附近的美食,则可以通过语音门户说“查询附近美食”,语音门户则会打开地图软件,并搜索附近餐馆。最直接的语音门户的商业模式就是从被引导的用户消费中提成。比如,用户通过语音门户打开团购软件,并团了100元的美食,其中2元是团购软件的提成,语音门户则可从这2元中提成。

语音工具类:这一类应用仅仅用来识别用户的语音输入,后向导入功能

较弱,语音输入法就属于这一类产品。当然,这一类产品可能的商业模式仍值得探索。

目前安卓应用下载的主要渠道有谷歌的“谷歌商城”,中移动的“MM”商城,百度的“91助手”,软银的“豌豆荚”,腾讯的“应用宝”和“360手机助手”。我们不去探讨谷歌在中国的业务,而中移动的MM商城则不提供下载数,我们不去研究。苹果手机的语音相关应用由SIRI垄断,其它语音助手多为功能阉割版本,我们在此也不做研究。

在语音输入法领域,讯飞语音输入法是目前市场上最主流的主打语音的输入法,其它输入法带语音输入的功能的也只剩下百度能与讯飞抗衡了。语音输入法考验技术实力,要做到实用,并且支持上亿用户,需要庞大的研发和资金投入。而目前输入法的盈利模式尚未出现,因此由讯飞和百度这样的大厂商一统江湖的格局会延续。同时,语音数据库也会由互联网巨头继续垄断,进一步提升语音行业门槛。

由于语音助手应用的商业模式雏形已现,因此市场争夺还是非常激烈的。虫洞、智能360、百度等语音助手都希望在移动互联语音门户市场分一杯羹。讯飞的“灵犀”和“语点”,合计占据约61%下载量,达4585

万次,如果考虑到其它应用商城,以及讯飞大股东中移动的定制机预装量和MM商城的下载量,估计总下载超过1亿次。如果10%是活跃用户,那么估计活跃用户仅为1000万户。可以说,讯飞暂时已经占据移动语音门户龙头位臵,但市场尚处于初级阶段,竞争格局尚未最终确定。

目前市场上主要应用产品的技术都源自来自科研院所,主流语音应用技术来源都是中科大,而讯飞则是该门派中的带头大哥,其纯正的血统和深厚的内功,足以傲视群雄。其它比较有影响力的科研院所有:

中科信利(中科院声学所):主要研究方向包括:语音信号处理、语音识别、语种识别、说话人识别/确认(声纹识别/确认)、关键词检测、以音频为载体的信息掩蔽(水印)、目标音频检索、基于内容的音乐检

索、目标人变声等。实验室承担了国家863、973、国家网络与信息安全中心、国家自然科学基金、中科院知识创新工程和中科院百人计划等项目;在产业化方面,中科信利语音实验室能够提供国际一流的语音技术产品和解决方案。研发产品涵盖服务器平台(电信级)、桌面平台和嵌入式平台(无线终端设备,PDA,掌上设备等)。中科信利研发的电信级语音识别产品已在国内20余个省级电信运营商中进行商业化运营;桌面平台语音识别产品已成为英特尔数字家庭台式电脑的捆绑软件;嵌入式平台产品已集成于国内多家手机厂商和PDA厂商的产品内。

清华语音识别实验室:联合清华大学电子工程系和计算机系在语音识别领域的研究力量,面向市场需求,着力推进语音识别技术的应用研究。实验室研究内容包括:非特定人大词汇量连续语音识别技术(听写机技术),有限命令集语音识别技术(语音控制技术)和语音关键词识别检测技术。开发出的语音电话交换机系统、声控拨号系统和信息查询系统等已经投入了实用。

北交大物理所/信息所:语音声学模型,韵律建模以及言语数据库的研究。言语信息处理理论及应用研究,涉及语义的言语表现及计算,及其在语音识别/合成中的应用。

3.2把握垄断智能电视语音入口

市场研究机构中怡康公布的2013年度彩电市场销售数据显示,13年约五成彩电销量来自智能电视。2013年中国彩电市场内销零售总量为4781万台,同比增长13%,随着宽带中国政策的持续推进,智能电视渗透率进一步上升,从年初的37%上升至四季度的50%以上,其56.84%的增长率远高于电视行业整体8.66%的年增长率。目前市场上国产智能电视的语音技术多由科大讯飞提供,可以说讯飞垄断了全国智能电视语音入口。13年国产智能电视出货量约2500万台,15年国产智能电视出货量达到5000万台,智能电视的渗透率将超过50%,这样讯飞到15年将很可能拥有5000万用户。

3.3占据OTT语音入口

目前市场都推出各种版本OTT,由于传统操作的局限性,整合语音控制势在必行。除了百度爱奇艺盒子之外,目前的盒子厂商的语音模块都由讯飞提供。预期14年盒子出货量在1200万台左右,15年将达2000万,讯飞将掌握其中绝大部分的入口。

3.4运营商定制机深度合作

垄断中移动入口。中移动智能机大部分预装“灵犀”,估计智能机占比会超过90%。中联通和中电信都是讯飞战略合作伙伴。由于没有定制产品,中联通和中电信也可能会选择其他合作伙伴。

3.5嵌入式软件语音门户掌门人

后向分成是主流的商业模式。目前嵌入式语音技术是为其他软件提供语音模块,客户都是讯飞的后向合作发展对象。市占率越高,分成越大,也可以通过第三方软件导入合作客户。

3.6抢占车载语音市场

在国内,讯飞与BBA、上汽全面合作企业,面对百万级高端用户群。奔

驰、宝马、奥迪的国产车车载语音识别预装产品全部在谈,近期可能全面供应中文语音人机交互系统。讯飞已经进入上海汽车荣威市场,目前与国内自主品牌高端产品都在谈。

3.7国产智能机语音芯片领跑者

国产嵌入式芯片的主要供应商。公司最新一代智能语音芯片

XFS5152CE,高度集成了中英文合成、语音编解码等强大功能,实现了单芯片语音识别的应用突破。支持任意中英文文本的合成及中英文混读,对数值、符号等特殊文本的合成顺畅自然;支持语音编解码功能,用户可以通过芯片直接进行录音和播放;支持语音识别功能,并且用户可以根据自己的定制需求进行扩展;支持UART、I2C、SPI三种通讯接口,及外扩提示音接口,能够满足用户自行添加提示音的需求;支持多种控制命令,如停止合成、暂停合成、状态查询等,便于用户开展工作。国产智能机:亿级定制入口。高端国产智能机上将直接使用嵌入式语音芯片。华为率先使用讯飞芯片、其他可以实现软/硬件定制。联想、小米、OPPO都是讯飞的战略合作伙伴。定制的语音芯片将为手机厂商实现定制功能和完美的用户体验。

3.8智能穿戴语音交互新天地

人机交流主要依靠语音,通过头部晃动,眼睛转动,触摸等方式都只能提供有限的功能,是初级阶段产品。讯飞已经开始研发相关配套系统,是未来可穿戴产品的最佳中文语音入口提供商。

3.9智能家居真龙头

“产品+app”的商业模式:灵犀3.0加入了“智能家电”模块,在应用扫描并添加了周围的智能电视、智能空调、智能电灯等智能设备之后,用户就可以利用灵犀3.0“声控”智能家庭设备。

精准的语音控制:公司在一场关于智能家居产品语音交互的发布会,搭建了一个智能家居的体验场景,通过灵犀助手3.0的智能家电模块,可以对临时搭建的这一体验场景中的每一款产品进行控制。首先,将智能电视、空调、电灯等联网,再打开灵犀助手3.0进入智能家电模块,此时已经将联网的智能家电产品全部显示出来,董事长刘庆峰先演示了最

相关主题
文本预览
相关文档 最新文档