剛剛聽到C++之父本賈尼的演講讓我思緒萬千,作為C++的忠實粉絲和使用者,讓我想到我用C++寫代碼的青蔥年華和激情燃燒的歲月。感謝本賈尼先生發明偉大的C++語言,改變了我這一代人的工作方式。
大家好,我叫姚星,來自騰訊,在騰訊工作了12年。一個多月前集團公關部的同事告訴我,希望我可以參加TEDx,講述一下騰訊背后的科技原力,我當時說我不知道講什么,因為我們做的事情都很普通也很平凡。同事說這樣不行,他一方面告訴我TEDx是一個很重要的presentation,另外一方面也告訴我騰訊作為一個世界級的互聯網公司過往做了很多世界級的產品,但在對外的技術宣傳上少之又少,我們有責任通整個行業進行我們技術上的經驗和教訓的交流。我一想也是,仔細想來,雖然我們的工作很平凡也很普通,但是平凡中會折射出與眾不同,今天我就和大家分享一下騰訊認知的"科技的原力"。
原力是什么?按照《星球大戰》電影的定義原力是"一種極大的能量"。
首先看一組數據:10000億,100億,4小時。10000億是如今全球IM一天的消息總量,這是個極大的數字,如果我們把它換算成書籍的容量,它大概是1億冊,相當于中國最大的圖書館——中國國家圖書館藏書量的5倍;100億是當今全球一天的圖片分享總量,這個數字如果用數碼相機一秒鐘拍一種照片的速度衡量,它需要用300年才能產生100億的照片,如果我們把這些照片連接起來,它可以繞地球50圈;4小時是現在我們平均每天上網的時長,這個時間已經超過了我們觀看電視的時間。
這些數字的背后也是信息產業的3個時代,過往的20年是信息時代快速發展的20年,信息產業的發展已經超過了其他產業,它經歷了3個時代:分別是窄帶時代、寬帶時代和移動互聯網時代。
窄帶時代,我們的網絡傳輸效率比較低,主要解決的是溝通問題,人們無需再像古人那樣"飛鴿傳書"或者通過傳統的郵件進行通信。人們可以通過internet實時的傳輸我們的消息,我們可以結交更廣闊的朋友,無論身處天涯海角,只要能連接上internet,信息總是可以觸手可及。隨著基礎網絡設施的發展,網絡傳輸的效率和容量越來越大,我們進入了寬帶時代,在寬帶時代人的訴求不再僅僅是溝通,更大的訴求是信息分享,"人人為我,我為人人",人們在朋友之間分享快樂,總結教訓;人們在更廣闊的互聯網世界里幫助他人,或者尋求幫助;人們在熟悉的、不熟悉的,認識的、不認識的人之間傳遞信息,分享信息。隨著3G/4G移動通信網絡的發展,智能手機的普及,我們又進入到了移動互聯網時代,移動互聯網時代人們不再像原來那樣要在指定地點,特定時間段連接信息世界,人們可以每時每刻、隨時隨地連接互聯網世界。
信息時代的發展推動了整個互聯網產業的發展,也提升了我們的生活質量和水平,每個階段都誕生了極具有代表性的互聯網產品,它們的出現改變了人們的生活方式,也深深的影響了我們這代人的生活。
QQ就是窄帶時代極具代表性的產品。大家還記得那個網絡傳輸效率較低的年代google的首頁嗎?google的首頁為何如此簡潔?google的誕生是1998年,也是身處窄帶時代,如果看它的首頁字節,大小是小于1024的,為什么要小于1024字節,因為以太網的MTU(也就是以太網最大傳輸單元)是1024,google為了讓用戶在一個網絡包中傳輸完成,所以它把頁面大小降到了1024以下,這是一種極致傳輸的表現。QQ的背后也蘊藏著諸多極致追求,早期的QQ客戶端安裝包是幾十k的大小,是為了讓用戶更快下載,更方便使用。QQ后臺的通訊協議是修改過TCP協議站的,之所以這樣是因為QQ希望傳輸協議既具備TCP的丟包重傳能力,又要具備UDP的高性能,這樣QQ可以在保證傳輸信息的同時又可以維護更多的用戶網絡連接,在那個年代QQ的單位后臺處理能力可能是其他同類產品的10倍以上。
QZone是寬帶時代的杰出代表產品。2013年Facebook的公開數據顯示Facebook的日上傳照片數為3.5億張,總照片存儲數達2500億。今天的QZone日上傳照片峰值超過5億,照片總量達6000億,和Facebook同一級別!照片的存儲是寬帶時代極具挑戰的技術難題,它不光是海量存儲的問題,而且還有海量訪問的問題,因為你的照片不僅僅是你自己訪問,你的朋友也會來訪問,它帶來的性能開銷是幾十上百倍的。存儲的難題除了性能還有成本,極致性能下的極致成本。QZone的后臺存儲系統是一個在物質介質上重新實現的一套存儲系統,它是一個非常有挑戰的技術,它對文件系統的inode索引進行重新設計,使得存儲系統既能充分的使用磁盤空間,又能很好的管理照片這樣的"小文件"。QZone后臺存儲系統迄今為止在整個后臺里面也是領先的。
微信是移動互聯網時代的超級APP,它不僅是一款IM,也是一款SNS平臺,同時能進行內容分發,還是智慧城市的入口;它不僅能發消息、分享朋友圈,它還能打車、吃飯買單、購物、交水電費,甚至預約看病掛號。超級APP肩負著超級責任,有數據顯示,Amazon的AWS服務宕機持續時間超過40s,上面的服務像Slack、Netfilx、Pinterest等多款APP會出現無法響應等問題。大家還記得去年的天津濱海新區的爆炸嗎?在爆炸的中心區域就有我們Wechat的數據中心,那次的事故為什么沒有影響到Wechat的穩定運營?因為很快我們把Wechat的服務切到上海、深圳的數據中心去了。因為我們深知Wechat的每次閃斷不僅僅是一條消息的延遲到達,不再是查看朋友圈時的緩慢,更重要的是你吃晚飯后結賬時的困境,也可能是明天無法及時看病的苦惱。Wechat的后端采用了全球分布、用戶就近接入的架構,在數據的一致性,網絡的可靠性做出了極多的容錯、容災設計,這種極致架構不僅能應對人禍,還能應對天災。
信息時代的科技原力是"摩爾定律",摩爾定律提升了基礎網絡建設的進程,讓我們的互聯網產品能快速更新。
2016年是AI起源的Dartmouth會議60周年,人工智能在過往的60年發展中幾經沉浮,起起落落,在今年散發出璀璨的光芒。人工智能的興起是大數據、云計算科學進步的產物,也是人類對未來世界向往的必然。
什么是AI?AI是研究如何應用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術。AI包括:計算機視覺、語音識別、自然語音處理等類似人類的感知、認知智能。
當下很多人認為AI就是機器學習,或者說是深度學習,這是很狹義的,機器學習是AI的核心算法,確切的說AI和機器學習的關系是這樣的:AI = A->f(x)->B,機器學習是人類智能行為的一種擬合函數。
目前的AI總體來講還是一個非常初級的階段,雖然我們在某些"感知"智能上有些突破,比如我們在計算機視覺上的人臉識別能力,語音識別上的速記能力等垂直領域已經接近或者超過人的平均智能水平,但是這些相對于一個人的綜合智能來講都還是一個非常狹窄的。之所以這樣,本質上來講,我覺得還是算法本身還需要更高維的突破,而不是簡單的演進。比如我們針對視覺的AlexNet到VGG再到現在的ResNet,每次算法的演進還只是停留在更深的神經網絡、更復雜的神經網絡連接的設計上,通過這樣復雜的神經網絡學習、更多的樣本特征來更好的擬合人腦的"感知",再比如"認知"智能的自然語言處理,但是面對這種語言序列問題,盡管我們的神經網絡從早期的RNN演進到LSTM,再到現在的Attention Model,但至今為止機器還無法完全勝任這種復雜計算。
人的智能是一個非常高的起點,人是經過數十億年的生物進化,即便是新生兒,從他一出生開始他的智能起點就非常高,比如出生不久人就知道這個時間是3維的,如果我們把東西藏在某個大型物體后面,人的本能就能知道。這是一個非常高的智能起點。人認識新生物也只需要少量樣本就能學會,但目前的機器學習并不能做到這樣,我們無論設計多么領先的神經網絡模型,都需要重新訓練數據樣本,并且需要大量數據訓練樣本的訓練擬合。但目前的本身的機器學習方法我認為是正確的,因為我們學習的不在是表面現象而是深層次的特征。這就猶如人類學習鳥兒飛翔不是仿照鳥一樣粘上羽毛,來振翅飛翔一樣,本質上的飛翔原理是空氣動力學和流體動力學。
AI的核心算法如何突破?如果類比人,我想需要在3個方面進行突破。1、創造力;2、歸納總結能力;3、舉一反三能力;如果它們對應到機器學習就是"強化學習"、"無監督機器學習"以及"遷移機器學習"。"強化學習"已經通過deepmind在Atari和alphago上證明了巨大成功,alphago之所以厲害,是因為通過強化學習自對弈產生了大量的非人類棋局樣本,通過這些樣本再來進一步學習提高,未來我們需要采用"強化學習"創造更多的數據。"無監督機器學習"至今為止沒有好的"聚類"算法,也就是歸納總結能力。人類能給表面非因果關系總結出很多原理,如"三點確定一個平面","慣性定律"等,這是一個很強的高維抽象能力,未來的無監督機器學習需要在這上面進行突破,通過少量的樣本,站在前人基礎上的歸納總結。"舉一反三"也是人的一個重要的基本能力,通過學習了"下圍棋",快速的推演到"下象棋",這需要"遷移機器學習"在模型遷移上的突破。
信息時代的科技原力是摩爾定律,AI時代的科技原力是"算法",而且這種算法是有如人類進化一樣,從"單細胞"到"多細胞",再到"智能"的演進過程。
AI的未來是什么?我想AI的未來不僅僅是給我們提供更加安全、更加高效、更加便捷的智能工具,而是要幫助我們實現每個人心中的那個"大白",那個超級英雄,使得我們的小朋友更加的"被理解",他們不會由于父母的不在身邊而缺少陪伴;使得我們的成年人更加的"被保護",他們不會由于危險的工作而使得自身安全得不到保障;使得我們的老年人更加的"被照顧",他們不會由于在偏遠山區而得不到及時的治療。無所不在是AI的未來。
從18世紀的第一次工業革命開始,人類的每次進步都源于科技的進步。而當今的互聯網時代,從窄帶到寬帶,從移動互聯網,再到當下的AI無不是一浪又一浪的科技變革,這種科技的進步也猶如潮汐一樣一次次越來越猛烈的推動著我們進步。
我有時會問自己:是什么樣的力量在推動著人類對未知領域的探索和渴望,是什么樣的力量在推動著科技的進步?我想答案是"科技的原力","原力"是什么?原力就是我們改變世界的力量,原力就是每個人心中的追尋"自我主宰"夢想,原力就是人們仰望星空的感覺。而我們要做的就是在這"創造原力"的同時,保持這份"原力"的真正含義!may the force be with you!原力與你同在謝謝大家!
來源:XXX(非中文科技資訊)的作品均轉載自其它媒體,轉載請尊重版權保留出處,一切法律責任自負。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。有事發郵件至news#citnews.com.cn(發送時將#替換為@)。
[轉載標題:]
分享到微信
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。