科大訊飛副總裁李世鵬:AI至少在現在還取代不了人

創業邦 | Shirlin

10月19日,第一屆河北國際工業設計周在雄安召開,科大訊飛集團副總裁、訊飛研究院聯席院長李世鵬發表演講。

要點如下:

1、探索人工智能的兩種方式和人工智能三部曲。

2、目前的人工智能,實際上是人工的智能。

3、科大訊飛在人工智能領域的技術進展。

4、AI至少在現在取代不了人,是作為人的助手更好更有效率更準確的進行工作。

以下為演講實錄:

大家上午好,我今天站在這個舞臺上是代表科大訊飛講一下科大訊飛在人工智能領域的一些思想。

我們知道人工智能實際上是來勢兇猛,而且現在越來越熱,不管從投資屆、產業屆還是政府,都把人工智能當成一個救星,而且我們知道各個國家也許都在基于人工智能制定了很多戰略規劃,包括美國、中國。我們去年公布了新一代人工智能規劃,這件事充分表示了人工智能在未來產業上的一些應用前景。這一點我要提到的是,人工智能跟今天的設計有什么關系呢?其實做設計的人大家都知道,尤其在跟計算機交互里面有一個數據叫做自然交互,自然交互里面核心就是智能的交互,我們科大訊飛在語音上面做了很多事情也是為了幫助人們更好的擁抱各種計算技術。這是我們國家的一個三部曲,到2030年我們試圖在人工智能領域占領高地。到底今天的人工智能是怎么回事,是太多泡沫還是確實在改變我們的生活?下面就給大家介紹一下我們的思路,什么叫人工智能?人工智能每個人的定義都不太一樣,這是我自己給的比較學術方面的定義。

什么叫人工智能?人工智能對我來講不是計算方式的革命,以前的計算方式都是人去編程,計算機做事情,今天的人工智能是各種數據自己學習做事情的方式。為什么人工智能最近熱,一是大數據、二是強有力的計算能力,包括云計算,還有一個深度學習算法,這三個合在一起催生了今天的人工智能的主流的一些方法。所有事情都不是偶然的,人工智能發展到今天完全是科學技術發展到今天一個自然結果。

探索人工智能有兩種方式,一種就是現在主流的根據深度學習跟大數據基礎的人工智能方法,這是現在大部分應用里面都在用的一個方法,而且很有效。另外是對人腦和認真科學的研究,這方面其實是剛剛起步,研究了很多年也沒有太多進展,最近可能會有一些比較重要的一些進展,但是遠遠沒達到使用的目的。

為什么要從這兩個方面研究呢?我們今天大數據深度學習基于了人工智能方法的話,有兩個致命的缺點,一是對大數據依賴,二是特別耗能,人腦要工作可能只需要二十瓦的能量,遠達不到人腦的計算中心至少要消耗100萬瓦的能量,所以從這方面來看對人腦的探索一直在不斷進行。

人工智能三部曲,我們大家也知道,計算智能、感知智能、認知智能。感知智能包括今天的語音識別、人臉識別,包括翻譯都可以當做感知智能,只不過把一種信息從一種形式翻譯到另外一種形式,沒有增加新的信息,今天大部分成功的人工智能都是感知智能。認知智能是真正對內容進行了解,這里面就是涉及到深層的,對內容進行了解之后你才能知道怎么樣去進行推理,怎么樣做一些決定,所以基于這樣,對我個人來說,人工智能又分了五個層次,用中文講是通知、感知、認知、預知和決知。從大數據角度來講的話,一層比一層依賴數據更多,在頂層的話你可能要知道所有的信息才能作出一些有價值的決定,預知這一層更多的是你向計算機發出指明之前計算機已經猜出來你要做什么事情,這是在認知之后的更高層次,這跟我們今天做用戶交互設計也深度密切相關。

數據在人工智能現在的框架里是至關重要的,數據怎么去獲得呢?現在很多公司,包括科大訊飛等其他公司,我們有個人工智能資源部,資源部的目的就是在整合各能源數據輸送給人工智能學習的引擎里面去,去訓練我們的引擎。數據是一個瓶頸,怎么樣把很多數據融合在一起這涉及到很多方面,包括怎么拿過來用,怎么合理用,這都是數據互聯的標準或者協議。

一致性、連續性,基于上下文、兼容性、完整性、誰來控制數據,是用戶還是產生數據的企業還是利用數據的企業,這是很有意思的討論話題。AI的趨勢,實際上今天也提到過,AI今天無疑在各個方面給我們提供了很多便利,提高了很多工作效率,提高了我們識別物體的一些準確度,但是有一個最大的問題就是數據依賴性,所以今天很多傳統的在裝配線的一些工廠現在轉型做成數據標注工廠,信息工廠以前一排一排的流水線,今天是一排一排的電腦,很多年輕人在里面標注數據,尤其在貴州更明顯,所謂的人工智能,真正說是人工的智能。

現在確實是這樣,你給機器更多需要的資料,他就能取得更多的成績,這就帶來另外一個問題,在這個基于大數據的基礎上人工智能方法總有它沒有遇到過的一些情況,那么這個情況發生的話機器是沒法去控制的。前幾年特斯拉就出過幾個事故,特斯拉的設計本意是輔助駕駛,沒生成自動駕駛,但是人對AI的期望值太高了,所以就造成了一種現象,認為它是自動駕駛。如果有一些情況機器沒法去控制的話,人也沒法及時接過來,這就造成了很多問題。

基于小數據,像認知科學里面的研究方向是現在也特別熱,因為我覺得繼人工智能框架的變化最后我們有一個真正智能系統關鍵的一個因素,另外對于數據的隱私保護,這里面是另外一個問題了。就是說,包括科大訊飛提的一個概念,AI所有過程中人在環路里面,有什么好處呢?今天把人工智能神話了,不太可能,如果是機器在不工作的情況下怎么樣很快接入?在機器不工作的情況下,人的接入能不能提供新的數據,怎么優化AI的功能?在歐洲都提這個觀點,可能所有的AI系統里面必須有一個開關,如果機器不按照人的思路去做的話,把開關一關他就會正常了,所以這是一個特別重要的一個課題。

這是我對人工智能產業的分類,基本上分成基礎技術公司、水平技術工作、垂直應用公司,我覺得今天大部分在做第二種,第一種的話就是基礎技術把巨頭們霸占,一些新公司都是在這個基礎上有市場的垂直應用。但垂直應用它的問題就跟我們前面提到的一樣,仍然依賴于大數據,所以你要進到一個垂直領域里面你必須有大數據在后面支撐,數據從哪來,這是首先要考慮的問題。

下面給大家很簡單介紹一下科大訊飛在一些人工智能里面的一些技術進展。第一個是我們科大訊飛的合成,我們可以模仿任何人的語音去合成,我們可以講奧巴馬講的任何話,包括中文。另外就是語音識別,大家知道訊飛在語音識別上面也是國內頂尖的公司,我們的識別率在持續增長,在普通話里面已經達到了98%以上,訊飛的轉寫系統在各個會議里面充分應用,我們在2015年時第一次的轉寫準確率就已經超過了人類的轉寫員。還有一個方面,家里很多老人他們一輩子不說普通話,怎么能讓這些人擁抱互聯網、擁抱新技術呢?科大訊飛做了方言的語音識別。我們現在可以支持22種方言,很多方言我們達到了90%的準確率。另外在機器翻譯方面,機器翻譯到今天為止還是感知智能方面的東西,對翻譯內容并不是很了解,將來的話一定是對語音內容進行了解。

去年2017年科大訊飛的機器人首次通過了中國醫生資格考試,總分600分,機器達到了460分,及格是360分。我們把這些技術也用到了各種場景里面,同時我們也建造了一些生態或者平臺來幫助我們的客戶來擁抱AI技術,我們的理念是所有的要開放,包括硬件軟件、語音服務,還有一些數據平臺。我們的AIU平臺,2010年把語音技術放在云上提供給成千上萬的客戶來進行開發,我們現在的開發團隊數已經達到了83萬,大概有50萬應用正在開發或者已經開發,大概有19億的終端設備在用科大訊飛AI的服務。

硬件方面我們也有很多產品,包括我們最新的墨菲技術,在中國80%以上的機器人都用我們的產品,還有90%以上的家電都在用科大訊飛語音交互系統。實際上是這里面很重要的一塊就是數據,數據有三方面,一是用戶數據的隱私保護,二是怎么樣讓數據能夠充分融合起來,還有保證數據方的利益,這里面我們把數據的控制性交換給用戶,通過一個數據銀行的概念把所有的東西都串聯起來了。數據最后的保護可能是區塊鏈最終的一個解決方案。

下面是一些具體的應用,我們利用科大訊飛在醫生機器人積累的智能,幫助醫生發現遺漏或者疏忽的東西,幫助一般醫生達到專家水平。在教育方面,我們在圖文識別里面能把我們的學生的試卷或者作業通過掃描的方式轉升機器能讀懂的方式,能自動評價,并不是目的,而是通過評分的過程中能分析到學生到底錯在哪里,同時我們把它影射到建的某個學科的知識圖譜上面,在這個知識圖譜不但一目了然發現這個學生在某個概念上不清楚,甚至說在這個概念不清楚是因為前幾個概念也是不清楚,在這樣一個個性化的知識圖譜的情況下,機器就可以幫助教師制定一些個性化的教育方案,還有給學生布置個性化的教育作業,以后學生作業不是千篇一律,只會選擇給學生布置那些并不熟悉的概念或者一些問題,讓他去練習,這樣的話學生的效率和老師的料率都會提高,同時分數大大提高,這個系統在全國有一萬兩千多個學校正在使用。

我們一個理念是,AI至少在現在取代不了人,是作為人的助手更好更有效率更準確的進行工作,我今天演講就到這里,感謝大家!

1080x640.jpg

掃碼
關注
意見
反饋
返回
頂部
凤凰彩票靠谱吗_凤凰平台网址是什么_凤凰彩票真的还是假的?-【官方网址】