科大讯飞口述史:一家本土技术公司的10年侧影

发布者:独行于世最新更新时间:2016-10-20 来源: Pingwest关键字:科大讯飞 手机看文章 扫描二维码
随时随地手机看文章
    锤子手机发布会上,罗永浩现场演示了科大讯飞的语音输入,几乎一字不差的识别结果惊艳全场。老罗随后在发布会上对科大讯飞毫无保留的溢美之词也让不少人意外:这个很多人听说过的产品,真的值得那么高的赞誉?

    2013 年底,在一次拜访科大讯飞总部时,我们有机会听到科大讯飞副总裁江涛讲述了很多不为外界所知的老故事。

    [编者按]本文是科大讯飞副总裁江涛口述实录。科大讯飞的创业经历,是个典型的中国技术创业故事。从技术到商业,从实验室到市场……这个故事提供了一个路径样本,也是那 10 年本土技术商业史的一个侧影。

1. 讯飞前传

    讯飞的前传离不开“人机语音通信实验室”,这是中科大六系(也就是电子工程系)的实验室,八几年就成立了,导师叫王仁华,是中国语音界非常有名的泰斗级老教授。九十年代,国内做语音都会首推“二王”,南边是王仁华教授,北边是清华大学的王作英教授。

    我是 1993 年进科大的,当时科大的学生都管导师叫“老板”,因为他们都跟着老师在外边接活做项目(注:时代背景为知识分子到校外私企的打工经商潮)。王老师跟其他的“老板”差别在什么地方呢?这个实验室也在外面接活,也给大家发点小钱,但除了有一拨人接活挣点小钱之外,他还保留了一支相当精锐的部队,做国内最前沿的基础研究,就是语音合成、语音识别编解码相关的研究;第二个不同是,他不像大部分的老板——论文出来了自己的名字写在第一个,然后才是学生的。在王老师这里,这个模式如果是你先做的,就把你的名字写在第一个,把年轻人推出去。

    庆峰(注:科大讯飞创始人刘庆峰)1990 年进科大,到大五已经是非常强的主力骨干了。王老师把他的学生分成两拨,一拨是挣钱的,一拨是搞研究的,刘庆峰就是搞研究的头——虽然只是五年级的本科生。

    1998 年,在国家 863 比赛中,庆峰牵头拿了第一名,当时主要聚焦在语音合成技术。863对语音合成技术的评测标准是:播音员的标准是 5 分,普通人发音是 4 分,3 分是可以接受不反感。当时,在国家 863 多少年的比赛中,第一次有了3.0分,就是科大的代表队。当时一起参赛的还有很多代表队,比如清华、北大等等。

    这个奖也给庆峰很大的鼓舞,觉得应该做点什么,把这个研究成果进一步产业化。当时李开复在微软中国担任副总裁(注:1998 年 7 月,李开复在中国创建并领导微软中国研究院,现为微软亚洲研究院),准备把微软奖学金给庆峰,但这个奖学金是有条件的,必须到微软做一个月的研究。当时庆峰已经准备创业了,就说没法去一个月,后来微软的条件一降再降,最后降到过来两周也行,但他最后还是拒绝了。十几年之后,一次讯飞语音云开发者大会,李开复也到了现场,我们邀请他的时候,他很感慨地说,庆锋是这么多年来唯一拒绝过微软奖学金的人。

    当时还有一个背景,国外 IT 巨头纷纷开始涉足中文,1998 年,IBM 发布了语音系统,翌年被评为科技界十件大事之一。第一次在电脑上不用键盘就可以输入,大家都觉得这是一个很革命性的事情。在 IBM 影响下,英特尔、摩托罗拉、东芝等国外 IT 巨头都建立了语音研发中心,当时科大声学所、语言所、清华等等一些学校语音专业的学生,一毕业就被挖去,这些国外公司基本上把中国语音市场瓜分了。

    还有一个背景必须提,就是大学生创业潮。九八、九九年团中央呼吁大学生创业,CCTV 2 还专门在 1999 年春节前后拍了一期节目,请了很多大学生创业者去讲他们的故事。这是九八、九九年那一拨创业潮,但是后来我们上市的时候,一百多家企业就剩两三个了。

    这就是九八、九九年刘庆峰的状态——技术上很牛,研究生刚毕业,拒绝了微软,在大的语音产业第一次浪潮和大学生创业潮,以及国家863奖的激励下开始创业。

2. 创业

    创业的第一步不是马上成立一个公司,当时庆锋把我们忽悠去,讲也很也很简单:我们要把技术做好。

    我们先找了中国银行福建省分行下面搞的一个企业,这个企业的董事长是 1996 年的“全国十大杰出青年”,1997、1998年的时候做到“电子百强”的前四十几名,也算规模比较大的企业了。我们跟他合作,他们出钱在中科大办一个联合实验室,全称叫“中国科大中银天音智能多媒体实验室”,刘庆锋就是这个实验室的主任,也是中银天音公司的总工。相当于企业出钱搞一个研发成果,去市场上推广。

    当时的办公楼是在五里墩立交桥下面一处三室一厅的民居,所有的电脑围成一圈,上面吊一个电扇,夏天一边擦汗一边擦键盘。后来条件稍微好一点了搬到科大里面,但场地还是很有限。

    因为做语音要请一些播音员来录音,有一次请了一个播音员来录音,正好到中午大家就约他一起吃饭。那时候我们实验室就十多个人,吃饭就从外面的小饭馆端几个钢筋锅进来,每个锅里面一种菜,也没椅子,就站着吃。把这个播音员吓一跳,觉得这哪是搞研究的,就是一帮民工。

    这个实验室运行时间也不长,正式挂牌是 1998 年夏天,到 1999 年春节前后,福建中银集团经营上出现了困难,连实验室员工的工资都发不出来,情况还是非常严峻的。当时,实验室主任刘庆峰并没有召集大家开会说对不起,中银集团没法发工资,他背着大家偷偷四处打借条,借钱给我们发了工资。他当时仅仅是主任,也只是“打工仔”,但为了这个团队不散伙,自己借钱发了工资。借钱的时候他心里也受到强烈的冲击——我要有自己的公司,把命运掌握在自己手里。

    所以后来他成立了硅谷天音,全称叫“安徽硅谷天音科技信息有限公司”,是家注册资金 300 万的小公司。实验室的人都掏了一点钱,再从本地的投资方“忽悠”了一点钱就开始起步了。

    硅谷天音正式运作是 1999 年 4 月,但真正挂牌是 1999 年 6 月份,但是 300 万资金真是没多少,基础研究投入很大,到年底就基本花完了,必须要融资了。很幸运,我们在 1999 年年底融到了第一笔 3000 万的投资,融资的同时也正式改名为科大讯飞。

    当时的投资方也不是多牛的大 VC,而是安徽省的美菱集团、安徽省信托投资公司,还都是国企,但是因为在本地好沟通,加上当时地方政府也觉得这拨科大的优秀毕业生留下来不容易。拿到这 3000 万,这股气就过去了。

    这里有个小故事,300 万的注册资金到年底就基本上快干了。当时有一个同事的显示器老是坏,有一天他在过道里把庆锋拦住,说想换个新显示器。庆锋犹豫了几秒钟说,好吧,那就买一个,这个同事又补了一句,我想换个17寸的可以吗?庆锋就说了,现在帐上就剩七万块钱,你看着买吧。最终他也没换,每天就在煎熬的过程中,一直撑到 3000 万融资到账。

    拿到这 3000 万,刘庆锋首先做的就是资源整合。做语音,科大是一拨,中科院声学所、社科院语言所,还有清华都有做的很不错的团队。语音又是一个典型的交叉科学,涉及到声学、语言学、计算机工程处理等等,其实每个研究机构都有他相对擅长的环节。

    他当时就拿钱跟这些研究机构都成立联合实验室,而且给这些实验室投资,给他们股份。他还把中银天音时期的专利知识产权买回来,当时真是不惜血本。通过这些机制,科大讯飞把做语音的源头资源给整合起来了。这是最初的资源整合,之后我们整合的资源也越来越多。

3. “讯飞 Inside”

    融到钱后,就可以大手笔干活了。我们开始追逐自己的梦想,第一次做了 To C(面向消费市场)的产品——畅言软件。这是一款针对 PC 的软件,通过语音既可以有指令的操作,又可以有文本输入,我们第一次把手写输入的随意性和语音输入的快速性无缝整合在一起。

    这个软件的“成功版”卖两千块钱一套,我们在全国十几个省打广告,然后招商。把代理商请到合肥来,跟他们讲这个软件有多好多好,我卖你一套一千块钱,你卖两千块钱。这个代理看着觉得挺神奇的,就各自囤了一些货,但后来很快退回来了,一是不好卖,二是很多盗版。第一年卖了一千多万,但大部分都积压在代理商那里,搞的代理商叫苦不迭。

    这是我们第一次 To C 的努力。当时可以做事情的时候,我们就想改变人使用计算机的习惯,现在看来,这显然是超越我们的能力了。一方面,PC 已经比较好地解决了人机交互的问题,对语音的需求没那么迫切,而且换一台电脑就得重新训练;其次,商业环境也不成熟,那时候没有电子商务,得靠一级一级的代理,最后一级一级加价,价格就比较高;同时,盗版又大面积出现。从技术、需求、商业环境上,都还不太成熟,所以叫它蹒跚的起步。讯飞的成长中,我们犯了无数的错误,这是其中之一。

    讯飞商业模式第一次形成叫“iFLY Inside”,2000 年,我们在深圳参加高交会,华为的工作人员看到了我们的语音合成系统,觉得比他们的好,就把我们带到蛇口的那个楼里,十几个研发人员围着问了一个下午。后来,华为就决定跟我们签约了。

    签约后,华为开始测试我们的语音合成系统。我们在家里测觉得挺好的,结果到华为一跑,只能撑几分钟。华为给了我们很大的压力,在陈涛副总裁的带队下,我们最核心、最骨干的一些研发人员接近二十几天吃睡都在华为,饿了就吃点东西,困了就在地上铺个东西睡会儿。我们那个时候才知道电信级稳定性的要求。

    修改、优化后提交还是不够,华为在现场又发现了问题,需要反复的修改,这个过程算是“脱了一层皮”。从实验室状态的产品,在稳定性、工程化上面,如何满足真正大规模商用的要求,也是我们第一次面对。

    但是这一层皮脱掉了以后,以后再有谁测我们的系统,我们从来就没倒过。除了华为,当时的中兴、神州数码等等国内做智能网、呼叫中心、业务系统的,需要用到语音引擎都买讯飞。

    我们把语音的核心能力提供给合作伙伴,他来做具体的应用,这是“iFLY Inside”模式的确立。

4. 弯曲的直线

    讯飞犯过无数的错误,走过无数弯路,后来我们把它叫做“弯曲的直线”。

    现在讯飞有两个事业部,通信增值和移动互联。当年有一个叫“有声Email”的项目,我是总负责人,跟上海电信合作,在上海热线的邮箱系统第一次实现,当时觉得自己还挺了不起的。

    那个时候移动互联网还没起来,电话用户比互联网用户多得多,“有声Email”就是用电话来访问,让用户听互联网上的信息。这个还真卖了一套,但就是没人用。在做这些产品的过程中,我们也慢慢的知道了该如何做产品,如何做工程,如何研究用户需求。

    还有个项目叫“老师家长一线通”,希望通过智能的电话语音系统,解决老师和家长之间的沟通问题,现在有很多 App 也做这个,包括校讯通,但当时产品出来同样没市场。不过,这支团队后来进一步延伸出了通信增值事业部。

    2005 年,彩铃从韩国引入中国,迅速火了起来。当时运营商最困扰的是,电话热线里面只能提供“1” 到“9”的 9 首彩铃让用户来选。他们就找我们问,能不能用语音选彩铃。

    我们就做了“声动彩铃”这个系统,在安徽一试点成果非常好。当时,安徽的运营商就给我们推荐了几个单位,后来联通总部看到这个系统的成果,就进一步下文,说这个产品应该怎么用。这样,我们终于有了第一个能够覆盖全国的业务。

    它逐渐在全国形成了规模效应,后来中国电信得到了 C 网,开始做彩铃的时候,也是全面用我们的系统。中国移动也是。

    基于音乐和彩铃相关的语音业务平台,很多都是由讯飞来做。基于讯飞的语音核心技术之外,我们把音乐方向的应用真正做起来了。

    这几年,我们的通信增值事业部在原来音乐语音搜索上又进一步做了很多东西,比如个性化彩铃、基于特色的语音合成技术,可以让彩铃随时的更换。还有爱吼网(一个在线K歌的平台)。

    移动互联方面,包括输入法,我们的基础团队也是从这边延伸出来的。2002 年到 2005 年,我们把它叫做“弯曲的直线”,走了无数的弯路。

    “弯曲的直线”的另外一面是教育产品。我们教育产品线已经很长了,早期做的产品叫“会说话的书”,这是 2002 年开始做的重要项目,我们当时对它抱了很大的期望。在书底下有一个存储装置,包含语音合成芯片,可以把书的内容读出来,适合小孩。

    语音合成怎么用?当时想的就是大家除了看书以外,还有听的需求。这两款产品费了牛劲,因为是我们第一次做硬件产品。现在看来,这两款产品巨土,工业设计水平都比较低,包括用户体验也都不太好。

    但是,这次项目之后保留下来的教育产品条线,现在已经有几百号人、几亿的销售额,可能到未来会有几十亿。要是当时没做现在看来很疯狂的傻事,就没有今天的发展。

5. 联想和复星

    2002 年到 2005 年还有一件比较重要的事情,融资。讯飞第一笔融资是本地的国企,要进一步发展,得有更好的资本平台。当时我们比较幸运地引入了两个战略投资者,联想和复星。柳传志在 2000 年把联想一分为二,一半交给杨元庆,一半交给郭为,他那时候则开始筹建联想投资。当时他在全国投了一百家企业,第一家就是讯飞。

    联想给讯飞带来的东西确实很多,签约仪式当晚,柳传志跟庆锋有一次长谈,那次长谈留下了很多记忆,庆锋在他的管理实践中一直强调,比如说既要有理想,又不能理想化。另外一家大的投资者是上海复星,我们的投资是由浙江广信来持股的,一度拥有百分之二十几的股份。

    2002 — 2005 年期间,我们也开始做系统集成业务,现在每年有近亿的收入,当时如果不做这个业务,讯飞也活不到今天。做系统集成相对容易,给讯飞带来了一定的现金流,我们在本地也逐渐有了一定的影响力。2002 年,我们搞全国巡展,联想跟我们一起,现场怎么搭,礼仪怎么排,(联想)手把手教我们。

    复星又是另外一种风格,这两个公司正好是中国民营企业非常优秀的两种截然不同的代表。联想强调管理,聚焦专业化,复星的口号则是专业的多元化。复星最大的能力是对大趋势的判断,在投讯飞的时候,他们旗下有七个上市公司。

    复星最早做医药起家,后来判断未来几年房地产有大的发展,就果断把赌注押到房地产上,之后又很快地判断到下一个增长,投了几个钢铁上市公司。这种大手笔的资产运作,对于整个产业大势的判断能力,对刘庆锋的影响也很大。

    联想在管理上很细致,每个月投资经理都会来,但复星的投资经理一年来一次,有一次,他们的 CEO 过来跟庆锋说,你们可以稍微给自己多发一点工资,当时讯飞还在亏损阶段。所以,他们的关注点在这儿。

    在讯飞的亏损阶段,这些战略投资者还是比较重要的。当时我们也在持续反思,为什么我们老没能兑现他们投资进来时的承诺,直到 2004 年才实现盈亏平衡。在这之前,每年总是画一个饼,完成几分之一,第二年再画一个饼,完成几分之一。相对来说,这些投资者还是比较有长远的眼光。

    在这个过程中,我们的战略目标就逐渐清晰:从全球最大的中文语音技术和语言技术提供商,发展到全球最出色的多语种技术提供商。

    这个过程中,路线、战略制胜,我们强调的是有可能形成“喷泉效应”,领先地位不容易被资金和人力投入所复制的创业型企业,才有可能发展为基业常青的企业帝国。我们通过什么路线来达到这个目标?引用任正非《华为真相》里的一句话:“股票、房地产起来的时候我们也有机会,但是我们认为未来的世界是知识的世界,不可能是这种泡沫的世界,所以我们不为所动。”

    不光要有具体的目标,还要有明确的产业理念,正如“红军之父”托洛茨基讲过,孙中山跟其他军阀不一样的地方是他不专门搞军队,他有自己的理念,有明确的政治和宣传工作。也就是说,有具体的产业理念才能够真正的走得远,而不是挣快钱。

    注:本文中的关于科大讯飞的数据、组织架构等均截至 2013 年。
关键字:科大讯飞 引用地址:科大讯飞口述史:一家本土技术公司的10年侧影

上一篇:高通:AR-VR成为主流还需依靠5G的发展
下一篇:第五届中国云博会开幕 最亮眼“黑科技”即将揭晓

推荐阅读最新更新时间:2024-03-30 23:48

科大讯飞与英伟达深度合作 Tesla P4提供50倍算法速度提升
5月9日美国硅谷报道,今天,科大讯飞在英伟达2017 GTC(GPU技术大会)上宣布,讯飞平台将提供基于英伟达Pascal架构Tesla P4深度学习平台提供语音云服务,进一步提升讯飞语音云平台效率的。据科大讯飞美国分公司总裁李春燕表示,英伟达的GPU相对于使用传统CPU服务器而言,具有50倍以上的速度提升。原先需要两个月时间来迭代的算法循环,现在只需要一天就能完成。 目前,科大讯飞的语音服务规模已经达到了:超过35亿人次的在线日服务量、30万家合作伙伴、总用户数超过10亿,已经占据中文语音技术市场70%以上的市场份额。 李春燕介绍,科大讯飞从2013年便开始使用一英伟达GPU平台用于其人工智能产品,此次投入应用的Tesl
[网络通信]
科大讯飞的嵌入式语音识别软件与CEVA DSP深度整合优化
CEVA,全球智能和互连设备的信号处理IP授权许可厂商 (纳斯达克股票交易所代码:CEVA)宣布,科大讯飞的语音识别软件套装已经可以提供为CEVA的音频/语音DSP优化的版本。这种紧密集成的解决方案已经可提供给客户,并已嵌入到为消费类电子产品设计的量产超低功耗语音处理器。 由于语音处理和人工智能的进步,语音识别正快速成为消费类电子、智能家居、移动和可穿戴设备、监控、汽车和IoT设备的人机界面(HMI)的理想选择。科大讯飞是中国顶尖的语音识别解决方案提供商,也是基于语音的人工智能技术的全球领先者。科大讯飞和CEVA开展合作,为CEVA的先进音频/语音DSP优化科大讯飞的神经网络语音识别、降噪及回声消除算法,从而得到一种功能强大、高
[嵌入式]
科大讯飞再收购机器人企业,扩充商业版图
近期,企查查 APP 显示,近日,芜湖星途 机器人 科技有限公司发生工商变更,科大讯飞成唯一股东。 信息显示,芜湖星途机器人科技有限公司成立于 2016 年,注册资本 1000 万元人民币,经营范围包含: 智能机器人 的设计、研发、生产和销售;机器人科技领域内的技术开发、咨询、转让和服务等。科大讯飞进行收购是其机器人计划的一部分,双方也是早有合作。 芜湖星途机器人科技有限公司从创立之初就跟科大讯飞有紧密的合作关系,科大讯飞本身就是芜湖星途机器人科技有限公司的股东之一,占股 70%,最近,科大讯飞收购了芜湖星途机器人科技有限公司之后,科大讯飞可以在智慧城市项目中进一步发挥机器人的作用。 当然,科大讯飞对机器人的发展规划不止收购那么简
[机器人]
科大讯飞的AB面:IPO后超1/4净利来自补贴
人工智能正被市场热炒,而“当红炸子鸡”非科大讯飞(002230,SZ)莫属。 3月21日,自称“国内智能语音和人工智能产业的领导者”的科大讯飞发布2016年年报,《每日经济新闻》记者统计发现,一方面,192页的报告中“人工智能”这个关键词出现超过100次,体现出公司对“人工智能”的重视程度。公司2016年实现营业收入33.20亿元,同比增长32.78%;净利润4.84亿元,同比增长13.90%。但《每日经济新闻》记者发现,在“人工智能”热度的另一面,2016年度,政府补助以及收购的讯飞皆成并表产生的投资收益,为科大讯飞贡献了超过一半利润。 分产品看,营收占比排前三的依次为教育产品和服务(27.44%)、信息工程(25.07%)和电
[手机便携]
科大讯飞被拉黑名单?官方回应:未收到官方消息,无影响
据彭博社报道,美国当局正在考虑把中国语音识别公司科大讯飞列入黑名单。 知情人士透露,美国正考虑把科大讯飞、数据公司亚美柏科和未上市的北京旷视科技列入黑名单。 继美国封杀华为后,近日动作频频,接连传出中国科技产业不同领域的企业可能被列入黑名单,如海康威视(Hikvision)、大华等。 针对这一消息,科大讯飞回应:我们目前没有收到来自美国政府的任何官方信息,我们期望得到美国政府公平、公正的对待。科大讯飞目前海外业务收入占比不高;使用海外元器件的部分消费者产品,科大讯飞已有针对极端情况的应对措施和替代方案。即使极端情况发生也不会对科大讯飞的日常经营产生重大影响。
[嵌入式]
<font color='red'>科大讯飞</font>被拉黑名单?官方回应:未收到官方消息,无影响
李世鹏博士加盟科大讯飞任AI研究院联席院长
5月2日消息,科大讯飞正式宣布引入信号与图像处理、计算机视觉的国际顶尖人才李世鹏博士,担任科大讯飞副总裁、讯飞AI研究院联席院长。李世鹏博士将领导科大讯飞研究团队在人工智能核心技术上的探索和创新,助力科大讯飞的AI技术应用落地,并主导科大讯飞的国际技术合作拓展。 李世鹏,美国里海(Lehigh)大学博士、中国科学技术大学硕士和学士,IEEE Fellow,国家“****”专家,新一代人工智能产业技术创新战略联盟联合秘书长 。
[机器人]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新物联网文章
换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved