作者丨張俊林
編輯丨孟夕
人工智能最近幾年發(fā)展得如火如荼,學(xué)術(shù)界、工業(yè)界、投資界各方一起發(fā)力,硬件、算法與數(shù)據(jù)共同發(fā)展,不僅僅是大型互聯(lián)網(wǎng)公司,包括大量創(chuàng)業(yè)公司以及傳統(tǒng)行業(yè)的公司都開始涉足人工智能行業(yè)。盡管最近一年在資本市場(chǎng)趨冷的大環(huán)境下,AI 熱度有所下降,但從長(zhǎng)遠(yuǎn)來看,人工智能在各行各業(yè)獲得越來越廣泛的應(yīng)用一定是社會(huì)發(fā)展最大的趨勢(shì)之一。
從 AI 基礎(chǔ)設(shè)施來說,人工智能專用芯片的研發(fā)方興未艾,不僅包括英偉達(dá) GPU、谷歌 TPU,國內(nèi)的阿里、百度、華為等巨頭公司,以及大量創(chuàng)業(yè)公司,都在 AI 芯片方面加快布局,隨著 AI 應(yīng)用進(jìn)一步滲透到 IOT 等方向,相信對(duì)專用芯片的需求會(huì)越來越廣泛。而作為各種 AI 應(yīng)用開發(fā)工具的 AI 框架,也在之前的百花齊放式發(fā)展中逐步收斂,目前形成了 PyTorch 引領(lǐng)學(xué)術(shù)界,TensorFlow 主導(dǎo)工業(yè)界的雙雄局面;而隨著中臺(tái)概念的日益興起,國內(nèi)大型互聯(lián)網(wǎng)公司也正在以 AI 中臺(tái)的面貌推出各自的高層開發(fā)框架,大量 AI 創(chuàng)業(yè)公司則逐步轉(zhuǎn)向金融、安防等垂直行業(yè)深耕細(xì)作的模式。
從 AI 技術(shù)進(jìn)展的角度來看,有幾個(gè)明顯的技術(shù)趨勢(shì)已日益凸顯。首先,隨著以智能手機(jī)為代表的移動(dòng)終端計(jì)算存儲(chǔ)能力快速加強(qiáng),端 AI 與邊緣計(jì)算技術(shù)正在快速發(fā)展與普及,如何在應(yīng)用效果盡可能高的前提下,將模型做小做精致做快,是這個(gè)發(fā)展方向的關(guān)鍵點(diǎn)。其次,傳統(tǒng)機(jī)器學(xué)習(xí)嚴(yán)重依賴訓(xùn)練數(shù)據(jù)的規(guī)模與質(zhì)量,這制約了領(lǐng)域技術(shù)的快速發(fā)展,而最近的明顯趨勢(shì)是由最常見的監(jiān)督學(xué)習(xí)向半監(jiān)督、自監(jiān)督甚至無監(jiān)督機(jī)器學(xué)習(xí)轉(zhuǎn)向,如何用盡量少的有標(biāo)訓(xùn)練數(shù)據(jù)讓機(jī)器自主學(xué)會(huì)更多的知識(shí),是大有前景的發(fā)展方向;第三,AutoML 正在快速地滲透到各個(gè) AI 應(yīng)用領(lǐng)域,從最早的圖像領(lǐng)域,目前已經(jīng)拓展到 NLP、推薦搜索、GAN 等多個(gè)領(lǐng)域,隨著 AutoML 技術(shù)的逐漸成熟,搜索網(wǎng)絡(luò)結(jié)構(gòu)成本越來越低,相信會(huì)有更多的領(lǐng)域模型會(huì)由機(jī)器來設(shè)計(jì),而不是目前的算法專家主導(dǎo)的局面,這個(gè)技術(shù)趨勢(shì)基本是確定無疑的。再者,隨著 5G 等傳輸技術(shù)的快速發(fā)展,視頻、圖片類應(yīng)用快速成為最主流的 APP 消費(fèi)場(chǎng)景,而機(jī)器學(xué)習(xí)技術(shù)如何更好地融合文本、圖片、視頻、用戶行為等各種不同模態(tài)的信息,來達(dá)到更好的應(yīng)用效果,相信也會(huì)越來越重要。另外,如何讓機(jī)器能夠生成高質(zhì)量的圖片、視頻、文本等生成領(lǐng)域,最近兩年也出現(xiàn)了大量有效新技術(shù)比如圖像領(lǐng)域的 GAN 以及文本領(lǐng)域的 GPT2 等模型,而這種具備創(chuàng)造性的生成領(lǐng)域,雖然之前由于受到技術(shù)發(fā)展水平限制,大家投入的精力不多,隨著相關(guān)技術(shù)日益成熟,這塊相信也會(huì)越來越重要。
從 AI 應(yīng)用領(lǐng)域發(fā)展趨勢(shì)來講,最主要的幾個(gè) AI 方向比如自然語言處理、圖像視頻處理及搜索推薦方向,最近一年來技術(shù)發(fā)展各自精彩紛呈,又呈現(xiàn)出不同的發(fā)展格局。

自然語言領(lǐng)域在最近兩年發(fā)生了天翻地覆的技術(shù)變革,進(jìn)入了技術(shù)井噴的快速發(fā)展期,而這一巨變的引發(fā)者是由 Bert 為代表的預(yù)訓(xùn)練模型及新型特征抽取器 Transformer 的快速發(fā)展與普及帶來的。從 Bert 的應(yīng)用來看,已經(jīng)在包含對(duì)話系統(tǒng)、機(jī)器閱讀理解、搜索、文本分類…。 等幾乎大多數(shù) NLP 應(yīng)用領(lǐng)域快速應(yīng)用,并在部分應(yīng)用領(lǐng)域取得了突破性的效果提升;作為剛提出一年多的新型研究范式,我們目前對(duì) Transformer 和 Bert 為何有效的理解還比較淺顯,同時(shí) Bert 模型還有很多值得深入改進(jìn)的方向,比如生成模型、訓(xùn)練方法優(yōu)化、長(zhǎng)文檔處理、多模態(tài)融合…。。 等,都需要進(jìn)一步更深入的研究。最近一年也陸續(xù)出現(xiàn)了大量效果突出的改進(jìn)模型,比如 XLNet、RoBERTa、ALBert、Google T5 等一系列改進(jìn)。相信隨著大家對(duì) Bert 的理解逐漸深入,對(duì) Bert 模型的快速改進(jìn)以及更多領(lǐng)域更好的應(yīng)用效果會(huì)成為 NLP 領(lǐng)域的常態(tài),我們?cè)诓贿h(yuǎn)的未來會(huì)看到 NLP 領(lǐng)域更多新模型的出現(xiàn),以及這些新技術(shù)推動(dòng)實(shí)際應(yīng)用場(chǎng)景的快速進(jìn)步。
圖像處理領(lǐng)域是 AI 的另一應(yīng)用主戰(zhàn)場(chǎng),但是,除了近年來深度學(xué)習(xí)、ResNet 兩大圖像處理領(lǐng)域的巨大技術(shù)革新外,最近兩年來,CV 領(lǐng)域并未有特別巨大的技術(shù)革新與進(jìn)步,目前進(jìn)入技術(shù)平穩(wěn)發(fā)展期。歸功于基礎(chǔ)技術(shù)的快速進(jìn)步,很多 CV 應(yīng)用已相對(duì)成熟,所以近年來我們體會(huì)更多的是各種前沿技術(shù)在各個(gè)行業(yè)的應(yīng)用落地與實(shí)踐。
對(duì)于推薦與搜索等具備較長(zhǎng)工業(yè)化發(fā)展歷史的 AI 應(yīng)用領(lǐng)域,深度學(xué)習(xí)在最近兩年已經(jīng)在各種互聯(lián)網(wǎng)公司比較廣泛地獲得了嘗試和應(yīng)用。盡管并未像 NLP 與圖像領(lǐng)域那樣,深度學(xué)習(xí)相對(duì)傳統(tǒng)模型獲得突飛猛進(jìn)的技術(shù)突破,而且對(duì)于比如推薦領(lǐng)域 DNN 模型的效果到底如何在學(xué)術(shù)上還存在爭(zhēng)議,但是相信這些領(lǐng)域如果能夠正確借鑒其它 AI 領(lǐng)域的技術(shù)進(jìn)展,會(huì)在未來兩年內(nèi)出現(xiàn)令人驚喜的效果突出的技術(shù)進(jìn)化。
綜合而言,AI 技術(shù)發(fā)展整體進(jìn)入快車道,不同領(lǐng)域又各有特色、發(fā)展階段以及各自的精彩。可以堅(jiān)信的一點(diǎn)是:相信 AI 會(huì)日益滲透到我們生活的方方面面,幫助我們生活得更輕松更美好!
作者介紹
張俊林,中國中文信息學(xué)會(huì)理事,中科院軟件所博士。目前擔(dān)任新浪微博機(jī)器學(xué)習(xí)團(tuán)隊(duì) AI Lab 負(fù)責(zé)人。在此之前,張俊林曾經(jīng)在阿里巴巴任資深技術(shù)專家并負(fù)責(zé)新技術(shù)團(tuán)隊(duì),以及在百度和用友擔(dān)任技術(shù)經(jīng)理及技術(shù)總監(jiān)等職務(wù)。他是技術(shù)書籍《這就是搜索引擎:核心技術(shù)詳解》(該書榮獲全國第十二屆優(yōu)秀圖書獎(jiǎng))、《大數(shù)據(jù)日知錄:架構(gòu)與算法》的作者。他本科畢業(yè)于天津大學(xué)管理學(xué)院,之后在中科院軟件所直接攻讀博士學(xué)位,研究方向是信息檢索理論與自然語言處理,就學(xué)期間曾在 ACL2006、COLING2004、IJCNLP2004 等國際頂級(jí)會(huì)議發(fā)表多篇學(xué)術(shù)論文。另外,他在此期間領(lǐng)導(dǎo)設(shè)計(jì)的搜索系統(tǒng)曾在美國國防部 DARPA 主持的 TREC 高精度檢索系統(tǒng)評(píng)測(cè)中取得綜合排名第一名的優(yōu)異成績(jī)。近年來,陸續(xù)在 Recsys2019 以及 ICDM2019 等國際會(huì)議發(fā)表多篇深度學(xué)習(xí)推薦系統(tǒng)相關(guān)論文。
福利時(shí)刻
張俊林老師將在 11 月 21-22 日的 AICon 大會(huì)上擔(dān)任“搜索推薦與算法”專場(chǎng)的出品人,想要跟張老師深入交流的,不要錯(cuò)過面基的機(jī)會(huì)。另外,大會(huì)還有關(guān)于機(jī)器學(xué)習(xí)、NLP、語音交互、智能金融等 50+ 最新落地案例,更有來自 AWS、微軟、BAT、華為等國內(nèi)外一線 AI 技術(shù)專家?guī)砀韶浹葜v,部分議題搶先看:
[螞蟻金服]金融知識(shí)圖譜在螞蟻的業(yè)務(wù)探索與平臺(tái)實(shí)踐
[菜鳥網(wǎng)絡(luò)]人工智能在智慧交通物流的技術(shù)演進(jìn)之路
[阿里媽媽]工業(yè)級(jí)深度學(xué)習(xí)在阿里廣告的實(shí)踐、創(chuàng)新與最新進(jìn)展
[微軟小冰]人格化對(duì)話機(jī)器人的構(gòu)建及在語音場(chǎng)景當(dāng)中的實(shí)踐
[百度]AI 大生產(chǎn)時(shí)代下的 NLP 技術(shù)創(chuàng)新與應(yīng)用實(shí)踐