百度在硅谷争抢人工智能大脑
百度吸引了深度学习研究领军人物吴恩达(Adrew Ng)的加入,并在加州桑尼维尔设立深度学习研究院。在此以后,吴恩达的学生、信徒也追随其来到百度,他的加入为百度吸引来了美国最顶尖的科学家。
李潮文
12月中旬的1天,我出门去百度位于加州桑尼维尔的研究院采访,当我对手机说出研究院地址,手机自动打开地图为我导航……
对用惯了智能手机的我们来讲,这1切早已稀疏平常,但想起20年前在小学机房,我需要用费力背下来的固定语句向Dos系统的电脑输入指令,就为了打开个文档,不能不感叹这些年人和机器之间交换的方式产生了怎样天翻地覆的变化——不用会写代码,乃至不用识字,用平时说话的方式就可以操作智能装备。
为了实现和机器交换能够像“和人聊天”1样,背后是为数不多的1群科学家数10年沉醉于神经网络和深度学习领域的研究——这是1个曾不被学界认可的领域,研究人员也经历过数次受追捧和被冷藏的沉浮。
几年前,谷歌等科技公司忽然意想到这个领域的价值,开始了重金争取这群为数不多的科学家,与此同时,这也让愈来愈多的公司加入这场“军备比赛”。
意外的是,百度作为1家中国公司卷入其中。作为1家中国公司在美国硅谷的研究院,百度位于加州桑尼维尔的研究院吸引了吴恩达(Adrew Ng)——深度学习研究领军人物的加入,让人大感意外,在此以后,他的学生,他的信徒也追随其来到百度。
1.
百度的研究院所在地桑尼维尔其实不是硅谷的核心肠区,1栋其实不大的建筑里,没有人有自己独立的办公室,大多数会面都在餐厅,吴恩达(Adrew Ng)在这个下午不时走到餐厅,像是安排了甚么会面,由于他的加入,即使是美国媒体在谈论深度学习时,也没法避开百度。
深度学习再1次遭到关注与这些科技公司的“军备赛”不无关系。2014年,谷歌花费4亿美元收购人工智能初创公司DeepMind,而此前Facebook对这家公司也在猛烈寻求;但Facebook其实不肯示弱,在谷歌具有Geoffrey Hinton这样的研究巨擎时,它约请到Hinton的密切队友——纽约大学Yann LeCun建立实验室;而百度,则约请到了吴恩达建立自己的实验室,他曾为谷歌建立了被外界称为“谷歌大脑”项目,能够在诸多图片中辨认出“猫”,成为谷歌最重要的研究成果之1,也是深度学习的里程碑。
Tesla的开创人Elon Musk最近的“参赛”更是让人闻到了炸药味。这名超人式的硅谷企业家曾不止1次对外界表达对人工智能的负面思考,担心人工智能未来会摧毁人类。而最近他表示,和Y Combinator的董事长Sam Altma1起出资10亿美元建立非盈利性人工智能(AI)研究机构Open AI,他表示,不希望人工智能在未来成为少数公司所独有的资源。撇开这个机构设立的目的,毫无疑问,它的出现会进1步加重人材之间的争取。
即使深度学习现在是炙手可热的领域,但几年前还是1个冷门领域,少有博士生从事这个领域的研究,而在这几年重新受人关注以后,专注于这1课题的博士生们大多还在学习进程中,因这人才极其稀缺。
“实际上这个领域有几次寒冬”,当我问Adam Coates,百度硅谷AI实验室主管,怎样看待上1次深度学习寒冬出现的缘由时,他纠正我说,其实不止1次,而是有很几次。
如果仅仅是跟风1个热门的领域,其实不需要1个企业需要太多前瞻眼光,但在深度学习领域的投入多少是具有不肯定性的,即使是在百度确立这个目标的两3年前。
早在1960年代,深度学习的前身“神经网络”概念雏形就已出现,轰动1时,关键词是“训练机器”,让机器能够辨认物体。但由于这1理论悬殊于传统人工智能研究方法——那种能够被数学计算证明的路径,同时由于当时计算能力的局限,并未在利用领域显示出自己的优势,终究在向政府争取研究经费时输给了传统派。到了1980年代末,神经网络重新被关注,《纽约时报》在头版位置报导,好莱坞也以此博取眼球,阿诺德·施瓦辛格扮演的机器人终结者说:“我的CPU是1个神经网络处理器,1个会学习的计算机。”但1960年代景象终究重现——神经网络依然没能到达外界预期,而被学界冷落。
只有1小群人坚持了下来,包括现在加入谷歌的Geoffrey Hinton和为Facebook主持实验室的LeCun1直坚持扎根于这1领域。
再次兴起带有偶然。2007年前后,计算机计算能力到达了1个新的节点,而Google等公司也搜集了大量数据,Hinton1个学生将Hinton的语音辨认技术导入了Google系统,旋即获得成功,这几近是让Google尝到甜头的开端,尔后几年间,Google花了较大精力投入,包括约请到吴恩达(Adrew Ng)和Hinton的加入。
“人工智能”这个词近几年几近被过度利用,投行、媒体或是企业开始用“深度学习”代替“人工智能”,分析它的商业前景、变现能力。
“1些企业家又在许诺,过几年以后深度学习又会带来怎样的愿景,毫无疑问这是过度宣扬。”下午3点,Adam百度餐厅旁会议室接受界面新闻记者采访时说,“多是由于我们身在其中做研究的原因,我们更关注眼下人工智能和深度学习能够做甚么。”他希望此次这些人不要对这个领域带来甚么负面影响。
Adam是吴恩达(Adrew Ng)的学生,今年32岁,典型的美国大学里好学生的模样,2014年跟随吴恩达1起来到百度。
2.
2014年5月,吴恩达离开Google,乃至逐步淡出自己的在线教育创业项目Cousera的管理,加入百度,主持这家中国公司的人工智能实验室。
对吴恩达加入百度的缘由,其实不乏媒体报导,大多诉诸于百度的“灵活性”,但这个理由仿佛其实不那末充分——最少在美国几大科技公司中,谷歌是具有相当灵活性的,Hinton曾表示,微软和IBM比谷歌都要先得到他的学生,但是在产品化上,谷歌比任何人都要快。
不管如何,吴恩达的到来为百度吸引到了最顶尖的科学家。Adam Coates在斯坦福大学师从吴恩达,研究进入博士后阶段时,“我问他,做甚么事情,在哪里做,能够让我们的研究在这个世界上能够产生最大的影响力?他告知我应当去百度。”
不管是吴恩达还是谷歌的Hinton或是Facebook的Lecun,这样学院派人物加入企业非常重要的1点是他能够带来自己门生和追随者。
在百度工作1年半以后,在接受界面新闻采访时,Adam同意了吴恩达当初的说法,他说百度让人激动的是百度的这些产品是和10亿级的用户紧密地联系在1起。
除此以外,这些顶尖的科学家愿意从大学实验室来到互联网公司的重要缘由就是数据和计算能力。关于数据对人工智能的重要性,谷歌开创人之1拉里佩奇和凯文·凯利之间的1段对话能够作为例证:早在2002年,在接受凯文·凯利采访时就表示,Google未来不是用人工智能改进搜索,人工智能未来是谷歌主营业务,谷歌将用搜索得到的数据来改进人工。而当2007年语音辨认产品在谷歌偶然被Hinton的学生运行成功时,基于的却是他若干年前的研究成果,“回顾往昔,缺少的只是数据量和计算能力”,Hinton当时感叹——彼时他经历了深度学习在学界数次沉浮。
百度也是依托数据和计算能力吸引到诸多科学家,Adam Coates在接受采访时不断强调数据量和计算能力的重要性。Tony Han说吴恩达和百度的数据量和计算能力是他加入的重要缘由,本来在Missouri大学担负副教授,受困于学校数据量和计算能力的限制,他给Andrew写邮件争取到了加入团队的机会。
但不管如何,是百度在人工智能领域确立了目标,才有后来吴恩达和1系列科学家的加入。
徐伟本来是Facebook的1名科学家,在吴恩到达来之前加入了百度。Facebook的开创人扎克伯格对办公室布局有1个有趣的偏好,他会把1段时间内他认为重要领域的同事安排在他附近的坐位,这样便于他随时学习这个领域的知识,而徐伟在Facebook就是坐在扎克伯格附近的人。徐伟在学生阶段学习的正是神经网络,在Facebook时也是利用神经网络解决这个社交网络的图片辨认等问题,但这家公司在2013年年初时并没有像Google和百度那样肯定地表示要在这1领域做研发投入,直到他加入百度半年后,Facebook才成立AI实验室。
作为1个中国公司在美国的研究院,要招聘到顶尖当地人材并不是易事。百度硅谷研究院2011年成立时,HR联系硅谷当地工程师,许多人都耽忧是不是该相信这样1家中国公司,“他们看得到,许多中国公司来美国设立办公室又撤走,招人又裁员”,郑字斌是百度美国研究院总经理,他清楚地看到这几年的变化,他说,从2011年起整整两3年的时间,百度主要是招中国工程师回国工作,这些人也许在Google这样的公司工作了78年时,事业到了1个平台期,而回国进入百度能够担负管理职位,有些人由于家人在美国或绿卡的缘由,还需要来回中国美国,“美国研究院在当时就类似1个方便他们出差的小办公室”。
1切都产生了变化,在吴恩达加入后。
3.
研究领域重要人物的移动意味着研究成果的跟随,吴恩达的加入意味着百度在深度学习领域起步于他之前的成果。
吴恩达在谷歌曾被外界广泛关注的成果就是机器在数百万张Youtube视频图象认出了图片中的猫。相比之前,这1“看图说话”成果的重要性在于,它利用的是1种“无监督学习”机制——研究人员之前并没有给这些图片标注过“猫”或其它名称,而机器在看了不计其数的“猫”以后,能够判定这属于同1事物——它们表现出来的统计模式已具有了足够的普遍性,从而可以将这些物体进行分类。
这对1两岁孩童是10分简单的事情,却是无数研究人员花费数10年试图去教会机器的。就是这样,对有规则可循的事情,比如能够用方程式所解释的,机器能够弄定人们穷尽1生都没法完成的计算量,但对没法从数学计算规则解释的事情,低龄儿童都能够完成的事情对机器来讲就像是不可能的任务。
相比之前研究人员需要像机器展现无数标注有“猫”的图片后,机器才能够在看到1张没有标注的图片,认出“猫”,无监督学习机制就像更接近人类某1种认知进程——小孩子在辨认猫时,其实不1定要去看几百万张妈妈为他标记有“猫”的图片,仅仅是学习到猫的模样,在偶尔1次问到“这是甚么”的时候,目前或是甚么人告知他们“这是猫”的时候,他们就学会了。无监督学习就是这样1种只需要在学习后期阶段干预,乃至是不需要干预的机制。
而以后1个重要的进展在于能够同时辨认不同的物体,乃至是物体特殊部份,然后可以用自然语言做出描写。
百度在此之上的1个重要进展就是可以对机器用复杂的自然语言发问:“除人以外,草坪上还有甚么”或是“那个人手里拿着甚么”,机器能够正确回答草坪上“还有狗”或是“手里拿着桔子”。
不单单是图象辨认,语音领域一样如此。就在Adam接受我采访确当天,百度发布了新的深度语音产品,在这背后是1条全新的语音辨认路径,“语音辨认过去是由很多部份组成的,让许多部份1起工作,最后要得到较为精确的语义传送是很难的,而我们是用的另外1条路径,由深度学习来代替既往那种许多细小的部份,最后的结果是更加精确的。”
“我们做中文实际上是从今年2月份开始做的,到今年8、9月份的时候我们已超过国内语音的辨认率了。”Tony Han是语音团队里唯一的华裔工程师之1,鉴于中文语言特殊性,他是参与了中文版本建设,“百度内部使用的最好中文语音辨认系统毛病率是7.7%,我们当时打算超过优于这个系统10%的时候就上线,也就是毛病率6.8%,但是我们6个月的时间把它推到5.7%了。”
但他们希望不断提高正确率。在语音辨认中细小的准确率之间的差别,在具体使用中却会有很大的差别。95%的精确度意味着每20个字里就有1个错别字,相当于每次在手机上使用语音辨认时都不能不回过头来纠正错别字,而99%则完全不同,语音辨认就已到达可靠的程度,就会1直使用,这4%的差别其实不仅仅是4%的渐进改良,在用户层面几近是1直用和几近不用的天壤之别。
Tony Han指出,百度语音辨认利用的“端到端”的路径是1个适用性较强的基础框架,在这个框架之下,只需要稍作改动,就能够运行另外一个语言的版本,这也是他们能够在6个月推出中文版的缘由。
“去年我们的那个版本在英语环境下运行得很好,而新版本在两个语言环境下都能够顺利运行。”Adam向我介绍说。撇开这类说明书式的描写,将它与Siri相比,能够明显地比较出优势。Siri没法同时支持中英文的——比如在我的iPhone使用英文系统时,Siri能够听懂我的英文指令,当我要求它给我通讯录里某个人打电话,如果这个人人名是中文名字时,它就没法辨认,除非你重新设定系统的语言。
“机器对自然语言的辨认,用你平时说话的方式交换,它就可以够明白你要做甚么,这对我来讲是相当激动的,完全改变了我们和装备的交换方式。”Adam说。但大多数我们其实不能为这类学术性的描写和几个百分点的进步而激动,但如果试图想象当无人驾驶汽车在路上运行或是机器人提供服务,需要对诸多意外状态做出自主自动的反应,就可以理解这些细小进步的意义。
4.
这类人和机器交换方式的改变对中国有特殊的意义。
百度最近关于深度学习产品化的1个重要方向就是在O2O产品中植入美国研究院的语言辨认成果,“我认为人工智能和O2O就是为彼此而生的,O2O正是把互联网的技术利用于线下的真实世界,为了提升O2O服务质量,电脑就需要理解人们在真实世界的那些行动,比如人们交谈的方式。”Adam为自己研究成果进入中国这样1个10亿级市场感到兴奋。
这样1个10亿级市场范围也意味着用户受教育程度良莠不齐。吴恩达在1次采访中指出,人工智能能够让中国非受教育用户群体便捷地使用智能装备——毫无疑问,这是前端科学民主的1面。
当Elon Musk等人表达对人工智能未来毁灭性的1面的耽忧时,这些身在其中的科学家想的是如何更好地教育机器,让机器能够更聪明的和人交换。“我认为人们说的人工智能将具有和人脑一样的能力的说法,现在是不可能的,我也没有看到在可预感的将来有创造这类东西的可能性。”Adam。
“长大进程中,我1直在看《变形金刚》,卡车汽车突然变成了机器人,我每天钻进汽车的时候,并没有担心它会突然变成机器人”。
如果说这些科学家们有甚么耽忧的,就是如何在公司事务中争取更多的科研时间。百度美国研究院扮演的是技术平台的角色,让百度其它工程师基于这个平台上开发出其它产品,“工作里,有相当1部份时间会花在怎样去让我们这个系统更好地支持百度各种各样的产品。”徐伟说,他更大的兴趣是在科研上,但直到今年才有了更多时间在科研上。
学界领军人物都进入了公司,外界层担心这会影响科研的进度。但从目前来看,Geoffrey Hinton依然在多伦多大学任教,除偶尔会来谷歌硅谷的总部,大多数时候只是在这家公司位于多伦多的办公室;Lecun依然在纽约大学任教,Facebook把实验室总部设在了纽约。
1线的科研人员在有钱有数据的公司中生存,而不是依赖于以往的政府研究基金,除去为企业牟利的1面,如果你想到以往的贝尔实验室,毫无疑问这有它积极的1面。
-
张艺谋妻女晒自拍母女颜值爆表
明星,怎么说也是个人吧。时不时晒晒照片,来个自拍什么的不足为奇。明星张婷与其女儿,在平安夜当晚晒自拍...[详细]
-
视帝陈豪爱妻陈茵媺爬山遇发哥为拍贴脸合照
视帝陈豪的爱妻陈茵媺“野生捕获”到周润发,抛开丈夫,完全放下矜持,就像树熊那样缠绕树干般搂紧周润发脖...[详细]
-
蒙面唱将猜猜猜第三季播出时间
《蒙面唱将猜猜猜》第三季于2018年10月21号每周日晚21:10分播出。《蒙面唱将猜猜猜》是江苏卫视的王牌节目,201...[详细]
-
郑爽才是中国好老板让助理出演角色进军娱乐
在年初的时候说到 中国好老板 ,大家的第一直觉就是我们的大幂幂了,用一部《三生三世十里桃花》把旗下的艺人...[详细]
-
盘点娱乐圈当下最俊朗的五大男神你喜欢哪一
靳东,1976年12月22日出生于山东,中国内地男演员。1993年,在电视剧《东方商人》中饰演少年高显扬;2005年,出演...[详细]
-
-
对您来说,干净的洗手间有多重要? 最新全球调查揭示后疫情时代人们对商用洗手间的看法
Excel Dryer, Inc.与MetrixLab的研究表明
-
维颜嘉西安国际医学中心新品发布会,中韩专家联袂推荐
杭州2024年11月24日 /美通社/ -- 2024年11月19日西安
-
"爱肺骑行,你我相伴"2024健康骑行公益活动圆满举行
上海2024年11月23日 /美通社/ -- 11月是国际肺癌关
-
全球首款IDH双靶点创新药在博鳌乐城实现"亚洲首用"
——Vorasidenib落地华西乐城医院并启动筹备真实
-
全球首款获批中美临床试验非病毒载体基因编辑药物在北京大学第三医院成功完成首例ATTR-CM...
苏州2024年11月25日 /美通社/ -- 近日,在北京大
-
星汉德生物SCG101一期临床革命性突破:乙肝根源性清除无复发,实现真正功能性治愈
新加坡2024年11月25日 /美通社/ -- 日前,在美国
-
-
-
肝纤维化不能吃什么?肝纤维化饮食的注意事项有哪些?
中国人口14亿多,其中有9000万乙肝病毒感染者
-
肝硬化需要全疗程用药吗?哪个品牌的软肝片好?用药讲疗程,安全有保证!
人们常说“慢性病要以慢治慢”。古人倡导“
-
肝硬化的突出表现有哪些?用什么药软肝效果好?保肝软肝就选中成药
肝硬化是一种常见慢性病,引起肝硬化的病因
-
肝硬化的前期表现有哪些?肝硬化前期该如何选择软肝药品呢?
中国人的饮酒文化众所皆知,都特别喜欢酒桌
-
肝硬化患者吃什么药好,复方鳖甲软肝片有效吗?疗效值得认可
我国是肝病高发生率大国,每年有超过120万病
-
肝硬化吃复方鳖甲软肝片怎么样?复方鳖甲软肝片功效与作用来评价
肝硬化是一种常见的慢性肝病,是由一种或多
-
-
-
-
-
-
-
-
-
-
-
-
-