99精品久久这里只有精品,三上悠亚免费一区二区在线,91精品福利一区二区,爱a久久片,无国产精品白浆免费视,中文字幕欧美一区,爽妇网国产精品,国产一级做a爱免费观看,午夜一级在线,国产精品偷伦视频免费手机播放

    <del id="eyo20"><dfn id="eyo20"></dfn></del>
  • <small id="eyo20"><abbr id="eyo20"></abbr></small>
      <strike id="eyo20"><samp id="eyo20"></samp></strike>
    • 首頁(yè) > 文章中心 > 卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程

      前言:想要寫(xiě)出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程范文,相信會(huì)為您的寫(xiě)作帶來(lái)幫助,發(fā)現(xiàn)更多的寫(xiě)作思路和靈感。

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程范文第1篇

      關(guān)鍵詞:手寫(xiě)數(shù)字識(shí)別;卷積神經(jīng)網(wǎng)絡(luò);應(yīng)用

      手寫(xiě)體數(shù)字識(shí)別在郵政、金融等領(lǐng)域應(yīng)用廣泛。對(duì)于數(shù)字識(shí)別,人們往往要求識(shí)別器有很高的識(shí)別可靠性,數(shù)字識(shí)別的錯(cuò)誤所帶來(lái)的影響比文字識(shí)別等其他識(shí)別所帶來(lái)的影響更大,特別是有關(guān)金融方面的數(shù)字識(shí)別錯(cuò)誤所帶來(lái)的后果是無(wú)法想象的,識(shí)別錯(cuò)一個(gè)數(shù)字,這其中的差距可能是幾的差距,也可能是幾十、幾百的差距,這些都還是小問(wèn)題;但更有可能這一個(gè)數(shù)字代表的差距是幾萬(wàn)、幾千萬(wàn)甚至幾億乃至更多,那么這個(gè)錯(cuò)誤造成的損失就無(wú)法估量了。因此,O計(jì)出有著高可靠性與高識(shí)別率的數(shù)字識(shí)別系統(tǒng)已經(jīng)成為了字符識(shí)別領(lǐng)域一個(gè)非常重要的環(huán)節(jié)。

      1 網(wǎng)絡(luò)模型和數(shù)據(jù)庫(kù)及學(xué)習(xí)算法的選擇

      1.1 關(guān)于Mnist數(shù)據(jù)庫(kù)的介紹

      首先,Mnist是NIST數(shù)據(jù)庫(kù)的一個(gè)優(yōu)化子集。它是一個(gè)有著60000個(gè)訓(xùn)練樣本集與10000個(gè)測(cè)試樣本集的手寫(xiě)體數(shù)字?jǐn)?shù)據(jù)庫(kù)。此數(shù)字庫(kù)一共有4個(gè)文件。

      此數(shù)字庫(kù)的所有樣本集都有圖像文件以及標(biāo)簽文件。標(biāo)簽文件的作用是用來(lái)儲(chǔ)存樣本集中的每個(gè)樣本的數(shù)值標(biāo)簽,而每一個(gè)樣本的圖像數(shù)據(jù)信息則是由圖像文件存儲(chǔ)著。此數(shù)據(jù)庫(kù)的圖像數(shù)據(jù)均保存在二進(jìn)制文件之中,且每個(gè)樣本圖像的大小均為28*28。

      1.2 數(shù)字識(shí)別的模型選擇

      手寫(xiě)體數(shù)字雖然只有0~9十個(gè)數(shù)字,但由于寫(xiě)法因人而異,不同地域同樣一個(gè)數(shù)字有多種不同的寫(xiě)法,每個(gè)人都有自己的書(shū)寫(xiě)習(xí)慣。且一些紙質(zhì)差異、筆畫(huà)粗細(xì)、光線問(wèn)題、位置、尺度大小等等多種因素都能對(duì)輸入產(chǎn)生影響??紤]到這些因素,為讓網(wǎng)絡(luò)有良好的識(shí)別能力,我們這里采用在圖像識(shí)別領(lǐng)域有著優(yōu)秀表現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)作為此數(shù)字識(shí)別系統(tǒng)的訓(xùn)練模型。

      1.3 學(xué)習(xí)算法的選擇

      一個(gè)優(yōu)秀的網(wǎng)絡(luò)模型必須具備良好的學(xué)習(xí)算法,每個(gè)學(xué)習(xí)網(wǎng)絡(luò)都有著相對(duì)來(lái)說(shuō)較為合適自己的學(xué)習(xí)算法,而并不是說(shuō)越高端的算法就越好。在此文中,我選擇的學(xué)習(xí)算法是較為成熟的BP算法。此算法在文字前面有些許介紹,此處不再多做說(shuō)明。

      2 基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)

      2.1 輸入層以及輸出層設(shè)定

      根據(jù)樣本的特征與此網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),可以大概判斷出輸入層與輸出層該如何設(shè)置。隱含層的個(gè)數(shù)可以是一個(gè),也可以是多個(gè),這與要分類(lèi)的問(wèn)題有關(guān)。

      前文提及到在mnist數(shù)據(jù)庫(kù)中,所有的圖像都是28*28大小的,且以整個(gè)圖片的像素形式存儲(chǔ)在數(shù)據(jù)文件之中。每張圖像大小為28*28,故一個(gè)圖片像素點(diǎn)個(gè)數(shù)為784個(gè)。這里,卷積神經(jīng)網(wǎng)絡(luò)的輸入即為這784個(gè)像素點(diǎn)。

      因?yàn)閿?shù)字識(shí)別需要識(shí)別的是0~9這十個(gè)數(shù)字,即需要識(shí)別十種字符類(lèi)別,所以將這個(gè)神經(jīng)網(wǎng)絡(luò)輸出層的神經(jīng)元節(jié)點(diǎn)數(shù)設(shè)置為10。

      2.2 網(wǎng)絡(luò)的中間層設(shè)置

      卷積神經(jīng)網(wǎng)絡(luò)的中間層有兩個(gè)部分,即卷積層(特征提取層)與下采樣層(特征映射層),由第二章中圖2-1所示,C1、C3為卷積層,S2、S4為降采樣層。

      1)激活函數(shù)選擇

      激活函數(shù)選擇sigmoid函數(shù)。同樣,在第二章有所提及。Sigmoid函數(shù)是嚴(yán)格遞增函數(shù),能較好的平衡線性與非線性之間的行為,比較貼近生物神經(jīng)元的工作。相比于其他函數(shù),sigmoid函數(shù)還存在著許多優(yōu)勢(shì),比如光滑性、魯棒性以及它的導(dǎo)數(shù)可以用它自身來(lái)表示。

      sigmoid函數(shù)為:

      (1)

      其中,x為神經(jīng)元凈輸入。

      激活函數(shù)導(dǎo)數(shù)為:

      (2)

      2)卷積層設(shè)計(jì)

      圖像經(jīng)過(guò)卷積核對(duì)特征圖進(jìn)行卷積,之后再經(jīng)過(guò)sigmoid函數(shù)處理在卷積層得到特征映射圖。特征映射圖相比于原圖像,其特征更為明顯突出。

      卷積運(yùn)算其實(shí)就是一個(gè)加權(quán)求和的過(guò)程。離散卷積是本文所選取的方法,規(guī)定卷積核在水平和豎直兩個(gè)方向每次都是移動(dòng)一個(gè)像素,即卷積的步長(zhǎng)為1。

      3)下采樣層的設(shè)計(jì)

      根據(jù)圖像局部相關(guān)性這一原理,為了降低網(wǎng)絡(luò)的學(xué)習(xí)維度、減少需要處理的數(shù)據(jù)量且保留圖像的有用信息,可以對(duì)卷積后的圖像進(jìn)行下采樣。這里,我們采取的是取卷積層4個(gè)像素點(diǎn)平均值為下采樣層的一個(gè)像素點(diǎn)的方法。這樣可以降低網(wǎng)絡(luò)規(guī)模。

      2.3 網(wǎng)絡(luò)總體結(jié)構(gòu)CNN-0

      根據(jù)LeNet-5結(jié)構(gòu),再結(jié)合上文中的對(duì)輸入層、輸出層、中間層的設(shè)計(jì),完成了如圖3-1所示的基本網(wǎng)絡(luò)結(jié)構(gòu):

      相比于LeNet-5,CNN-0做了一些修改,并非完全按照LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)模型。Sigmoid函數(shù)是本網(wǎng)絡(luò)中的激活函數(shù),選擇這個(gè)函數(shù)的好處在于可以讓所有層得到的輸出都在區(qū)間[-1,1]之內(nèi)。網(wǎng)絡(luò)訓(xùn)練的學(xué)習(xí)率固定值為1或者是衰減的學(xué)習(xí)速率。經(jīng)過(guò)卷積后的一維向量與輸出層沒(méi)有沿用LeNet-5的徑向基函數(shù)網(wǎng)絡(luò),而是采取全連接方式,省去了F6層。

      3.3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程

      在模式識(shí)別中,學(xué)習(xí)網(wǎng)絡(luò)有無(wú)指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)與有指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)兩個(gè)類(lèi)別。無(wú)指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)一般是用來(lái)進(jìn)行聚類(lèi)分析,本文采取的是有指導(dǎo)學(xué)習(xí)網(wǎng)絡(luò)。

      卷積神經(jīng)網(wǎng)絡(luò)其實(shí)就是從輸入到輸出的一種映射,它可以學(xué)量的映射關(guān)系,只需要用現(xiàn)有的模式對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,網(wǎng)絡(luò)就能具備映射能力。而不需要輸入與輸出之間的精確的關(guān)系。

      訓(xùn)練算法與傳統(tǒng)的BP算法相差無(wú)幾(BP算法在第二章有做概述),主要可分為四個(gè)步驟,而這四個(gè)步驟可以歸為向前傳播階段與向后傳播階段:相前傳播:

      1)隨機(jī)的從樣本集中獲取一個(gè)樣本(A, ),然后將A輸入至網(wǎng)絡(luò)中;

      2)根據(jù)公式(3)計(jì)算出實(shí)際輸出:

      (3)

      向后傳播:

      1)計(jì)算和理想輸出之間的差;

      2)根據(jù)極小化誤差方法調(diào)整權(quán)值矩陣。

      結(jié)語(yǔ)

      在手寫(xiě)數(shù)字識(shí)別這一塊,相對(duì)來(lái)說(shuō)比較有難度的應(yīng)該就是脫機(jī)自由手寫(xiě)字符識(shí)別了,不過(guò)本文所研究的并不是這一系統(tǒng),本設(shè)計(jì)是一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的手寫(xiě)數(shù)字識(shí)別系統(tǒng),因卷積神經(jīng)網(wǎng)絡(luò)的局部感受野和降采樣以及權(quán)值共享、隱性特征提取等優(yōu)點(diǎn),它在圖像識(shí)別領(lǐng)域得到了非常廣泛的應(yīng)用。此程序是在Caffe這個(gè)框架上進(jìn)行運(yùn)行的,操作系統(tǒng)為L(zhǎng)inux系統(tǒng)ubuntu14.04版本。Caffe是一個(gè)開(kāi)源的深度學(xué)習(xí)框架,也可以說(shuō)是一個(gè)編程框架或者模板框架,它提供一套編程機(jī)制。因此,本文所需要實(shí)際的卷積神經(jīng)網(wǎng)絡(luò)就可以根據(jù)這個(gè)框架來(lái)進(jìn)行構(gòu)建。

      參考文獻(xiàn):

      [1]張偉,王克儉,秦臻.基于神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別的研究[J].微電子學(xué)與計(jì)算,2006年第23卷第8期.

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程范文第2篇

      【關(guān)鍵詞】視頻 行為識(shí)別 檢測(cè)

      近年來(lái),各種視頻監(jiān)控越來(lái)越深入我們的生活中。因其實(shí)時(shí)性、直觀性以及設(shè)備成本日益降低在各行各業(yè)中而倍受青睞。但視頻監(jiān)控系統(tǒng)還是依靠人工來(lái)控制,沒(méi)有進(jìn)入數(shù)字化的全天實(shí)時(shí)監(jiān)測(cè)、智能分析圖像數(shù)據(jù)。要實(shí)現(xiàn)完全數(shù)字化的監(jiān)控的關(guān)鍵在于人體行為的智能識(shí)別。

      早些時(shí)候有人提出并且應(yīng)用了智能圖像識(shí)別的卷積神經(jīng)網(wǎng)絡(luò),它是在原始的輸入中應(yīng)用可訓(xùn)練的濾波器和局部鄰域池化操作,來(lái)得到一個(gè)分級(jí)的且逐漸復(fù)雜的特征表示。實(shí)踐表示,采用合適的規(guī)則化項(xiàng)來(lái)訓(xùn)練,它可以達(dá)到非常好的效果。比較好的地方是對(duì)姿勢(shì)、光照和復(fù)雜背景存在不變性,單只受限在2D輸入的舞臺(tái)。本文文章提出了一個(gè)新的3D卷積神經(jīng)網(wǎng)絡(luò)模型,用于運(yùn)動(dòng)識(shí)別。該模型可以從空間和時(shí)間的維度提取特征,然后進(jìn)行3D卷積,以捕捉從多個(gè)連續(xù)幀得到的運(yùn)動(dòng)信息。為了有效的綜合運(yùn)動(dòng)信息,文中通過(guò)在卷積神經(jīng)網(wǎng)絡(luò)的卷積層進(jìn)行3D卷積,以捕捉空間上、時(shí)間上的維度,讓其都具有區(qū)分性的特征。

      3D卷積是通過(guò)堆疊多個(gè)連續(xù)的幀組成一個(gè)立方體,然后在立方體中運(yùn)用3D卷積核。在其中,卷積層中每一個(gè)特征map都會(huì)與上一層中多個(gè)鄰近的連續(xù)幀相連,以捕捉運(yùn)動(dòng)信息。一個(gè)卷積map的某一位置的值是通過(guò)卷積上一層的三個(gè)連續(xù)的幀的同一個(gè)位置的局部感受得到的。要強(qiáng)調(diào)的是:3D卷積核只能從cube中提取一種類(lèi)型的特征,因?yàn)樵谡麄€(gè)cube中卷積核的權(quán)值都是一樣的,也就是共享權(quán)值,都是同一個(gè)卷積核??梢圆捎枚喾N卷積核,以提取多種特征。有一個(gè)通用的設(shè)計(jì)規(guī)則就是:在后面的層(離輸出層近的)特征map的個(gè)數(shù)應(yīng)該增加,這樣就可以從低級(jí)的特征maps組合產(chǎn)生更多類(lèi)型的特征。本文中的3D 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)包含一個(gè)硬連線hardwired層、3個(gè)卷積層、2個(gè)下采樣層和一個(gè)全連接層。每個(gè)3D卷積核卷積的立方體是連續(xù)7幀,每幀patch大小是60x40。

      在第一層,應(yīng)用了一個(gè)固定的hardwired的核去對(duì)原始的幀進(jìn)行處理,產(chǎn)生多個(gè)通道的信息,然后對(duì)多個(gè)通道分別處理。最后再將所有通道的信息組合起來(lái)得到最終的特征描述。這個(gè)實(shí)線層實(shí)際上是編碼對(duì)特征的先驗(yàn)知識(shí),這比隨機(jī)初始化性能要好。

      每幀提取五個(gè)通道的信息,分別是:灰度、x和y方向的梯度,x和y方向的光流。其中,前面三個(gè)都可以每幀都計(jì)算。然后水平和垂直方向的光流場(chǎng)需要兩個(gè)連續(xù)幀才確定。所以是7x3 + (7-1)x2=33個(gè)特征maps。然后用一個(gè)7x7x3的3D卷積核(7x7在空間,3是時(shí)間維)在五個(gè)通道的每一個(gè)通道分別進(jìn)行卷積。為了增加特征map的個(gè)數(shù)(實(shí)際上就是提取不同的特征),在每一個(gè)位置都采用兩個(gè)不同的卷積核,這樣在C2層的兩個(gè)特征maps組中,每組都包含23個(gè)特征maps。23是(7-3+1)x3+(6-3+1)x2前面那個(gè)是:七個(gè)連續(xù)幀,其灰度、x和y方向的梯度這三個(gè)通道都分別有7幀,然后水平和垂直方向的光流場(chǎng)都只有6幀。54x34是(60-7+1)x(40-7+1)。

      在緊接著的下采樣層S3層max pooling,在C2層的特征maps中用2x2窗口進(jìn)行下采樣,這樣就會(huì)得到相同數(shù)目但是空間分辨率降低的特征maps。下采樣后,就是27x17=(52/2)*(34/2)。 C4是在5個(gè)通道中分別采用7x6x3的3D卷積核。為了增加特征maps個(gè)數(shù),在每個(gè)位置都采用3個(gè)不同的卷積核,這樣就可以得到6組不同的特征maps,每組有13個(gè)特征maps。13是((7-3+1)-3+1)x3+((6-3+1)-3+1)x2前面那個(gè)是:七個(gè)連續(xù)幀,其灰度、x和y方向的梯度這三個(gè)通道都分別有7幀,然后水平和垂直方向的光流場(chǎng)都只有6幀。21x12是(27-7+1)x(17-6+1)。

      S5層用的是3x3的下采樣窗口,所以得到7x4. 到這個(gè)階段,時(shí)間維上幀的個(gè)數(shù)已經(jīng)很小了。在這一層,只在空間維度上面卷積,這時(shí)候使用的核是7x4,然后輸出的特征maps就被減小到1x1的大小。而C6層就包含有128個(gè)特征map,每個(gè)特征map與S5層中所有78(13x6)個(gè)特征maps全連接,這樣每個(gè)特征map就是1x1,也就是一個(gè)值了,而這個(gè)就是最終的特征向量了。

      經(jīng)過(guò)多層的卷積和下采樣后,每連續(xù)7幀的輸入圖像都被轉(zhuǎn)化為一個(gè)128維的特征向量,這個(gè)特征向量捕捉了輸入幀的運(yùn)動(dòng)信息。輸出層的節(jié)點(diǎn)數(shù)與行為的類(lèi)型數(shù)目一致,而且每個(gè)節(jié)點(diǎn)與C6中這128個(gè)節(jié)點(diǎn)是全連接的。采用一個(gè)線性分類(lèi)器來(lái)對(duì)這128維的特征向量進(jìn)行分類(lèi),實(shí)現(xiàn)行為識(shí)別。模型中所有可訓(xùn)練的參數(shù)都是隨機(jī)初始化的,然后通過(guò)在線BP算法進(jìn)行訓(xùn)練。

      3D 卷積神經(jīng)網(wǎng)絡(luò)模型的輸入被限制為一個(gè)少的連續(xù)視頻幀,因?yàn)殡S著輸入窗口大小的增加,模型需要訓(xùn)練的參數(shù)也會(huì)增加。當(dāng)然有些人的行為是跨越很多幀的,所以在3D 卷積神經(jīng)網(wǎng)絡(luò)模型中,有必要捕捉這種高層的運(yùn)動(dòng)信息。需要用大量的幀來(lái)計(jì)算運(yùn)動(dòng)特征,然后把這些運(yùn)動(dòng)特征作為輔助輸出去規(guī)則化3D 卷積神經(jīng)網(wǎng)絡(luò)模型。

      對(duì)于每一個(gè)需要訓(xùn)練的行為,提取其長(zhǎng)時(shí)間的行為信息,作為其高級(jí)行為特征。這個(gè)運(yùn)動(dòng)信息因?yàn)闀r(shí)間夠長(zhǎng),所以要比卷積神經(jīng)網(wǎng)絡(luò)的輸入幀的立方體包含的信息要豐富很多。然后我們就迫使卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一個(gè)非常接近這個(gè)特征的特征向量。這可以通過(guò)在卷積神經(jīng)網(wǎng)絡(luò)的最后一個(gè)隱層再連接一系列的輔助輸出節(jié)點(diǎn),然后訓(xùn)練過(guò)程中,使提取的特征更好的逼近這個(gè)計(jì)算好的高層的行為運(yùn)動(dòng)特征向量。

      試驗(yàn)中,在原始的灰度圖像中計(jì)算稠密sift描述子,然后通過(guò)這些sift描述子和運(yùn)動(dòng)邊緣歷史圖像(MEHI)組合構(gòu)造bag-of-words特征作為輔助特征。 因?yàn)榛叶葓D保留了外觀信息,運(yùn)動(dòng)邊緣歷史圖像只關(guān)心形狀和運(yùn)動(dòng)模式,所以可以提取這兩個(gè)互補(bǔ)的信息作為兩個(gè)連續(xù)幀的局部特征bag。先簡(jiǎn)單的計(jì)算兩幀間的差分,這樣就可以保留運(yùn)動(dòng)信息,然后對(duì)其執(zhí)行一次Canny邊緣檢測(cè),這樣可以使得觀測(cè)圖像更加清楚簡(jiǎn)潔。最總的運(yùn)動(dòng)邊緣圖像就是將歷史的這些圖像乘以一個(gè)遺忘因子再累加起來(lái)得到。

      本文中,構(gòu)造不同的3D 卷積神經(jīng)網(wǎng)絡(luò)模型,它可以從輸入捕捉潛在的互補(bǔ)信息,然后在預(yù)測(cè)階段,每個(gè)模型都針對(duì)一個(gè)輸入得到對(duì)應(yīng)的輸出,然后再組合這些輸出得到最終的結(jié)果。

      作者簡(jiǎn)介:

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程范文第3篇

      關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);反向傳播算法;仿射變換;sloth;python;theano

      中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)04-0096-02

      隨著環(huán)保壓力的增大,各國(guó)已經(jīng)開(kāi)始利用攝像頭來(lái)監(jiān)控漁船的捕撈活動(dòng),并運(yùn)用機(jī)器學(xué)習(xí)技術(shù)來(lái)對(duì)漁船捕獲的魚(yú)類(lèi)圖像進(jìn)行自動(dòng)的識(shí)別與分類(lèi)從而扼制非法的捕撈。

      目前計(jì)算機(jī)性能的飛速發(fā)展、圖像數(shù)據(jù)采集設(shè)備的廉價(jià)與普及促進(jìn)了機(jī)器學(xué)習(xí)理論與方法的發(fā)展,數(shù)據(jù)科學(xué)家已經(jīng)可以構(gòu)建復(fù)雜的機(jī)器學(xué)習(xí)模型并利用從廉價(jià)的數(shù)碼攝像頭設(shè)備采集到大量的數(shù)據(jù)快速的訓(xùn)練模型。吳一全等[1]采用了手動(dòng)選擇特征的方法, 基于支持向量機(jī)對(duì)5種魚(yú)進(jìn)行識(shí)別,各類(lèi)魚(yú)的識(shí)別精度平均為83.33%。萬(wàn)鵬等[2]計(jì)算魚(yú)的長(zhǎng)軸方向各段的平均寬度與長(zhǎng)度的比值并將其作為特征參數(shù),利用3層BP(back propagation)神經(jīng)網(wǎng)絡(luò)對(duì)鯽魚(yú)和鯉魚(yú)進(jìn)行識(shí)別,識(shí)別精度為92.50%。但是這些方法都是基于手動(dòng)選擇特征的機(jī)器學(xué)習(xí)方法,手動(dòng)選擇特征的方法基于人的經(jīng)驗(yàn)選擇特征, 會(huì)導(dǎo)致遺漏重要的特征, 導(dǎo)致分類(lèi)準(zhǔn)確率低。深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)能在訓(xùn)練過(guò)程中自動(dòng)學(xué)到“好”特征,避免了手動(dòng)選擇特征。本次研究采用了基于VGG16的卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)進(jìn)行魚(yú)類(lèi)分類(lèi),并運(yùn)用了數(shù)據(jù)集擴(kuò)增方法,dropout方法, batch normalization方法來(lái)降低模型的過(guò)擬合。但是原始數(shù)據(jù)集背景干擾很大,船上的人、物體和甲板上捕獲的魚(yú)類(lèi)糅合在一起,直接采用原始數(shù)據(jù)集訓(xùn)練會(huì)導(dǎo)致訓(xùn)練出的模型穩(wěn)定性不好。

      基于上述分析,本文從原始數(shù)據(jù)出發(fā),設(shè)計(jì)了一種目標(biāo)檢測(cè)方法,即在原始訓(xùn)練數(shù)據(jù)已經(jīng)有魚(yú)類(lèi)類(lèi)別標(biāo)簽的基礎(chǔ)上,再標(biāo)注上一層表示魚(yú)類(lèi)在圖片中坐標(biāo)位置的標(biāo)簽,然后利用這些二次標(biāo)注過(guò)的數(shù)據(jù)訓(xùn)練模型,就可得到一個(gè)既能預(yù)測(cè)魚(yú)在圖片中的坐標(biāo)位置又能預(yù)測(cè)魚(yú)的分類(lèi)的糅合模型。因?yàn)檫@兩種預(yù)測(cè)網(wǎng)絡(luò)在卷積層共同訓(xùn)練一套濾波器,所以在訓(xùn)練濾波器預(yù)測(cè)魚(yú)的坐標(biāo)位置時(shí),訓(xùn)練完成的濾波器便能在另一方面輔助預(yù)測(cè)魚(yú)的分類(lèi),使特征提取只專(zhuān)注于魚(yú)的坐標(biāo)區(qū)域,這樣就有效的排除了背景干擾。實(shí)驗(yàn)結(jié)果顯示此模型具有很高的識(shí)別精度和魯棒性,能在背景干擾很強(qiáng)的圖片數(shù)據(jù)集上準(zhǔn)確的完成魚(yú)類(lèi)的識(shí)別和分類(lèi)。

      1 模型構(gòu)建

      實(shí)驗(yàn)數(shù)據(jù)來(lái)源于某組織舉辦的圖像識(shí)別競(jìng)賽。數(shù)據(jù)通過(guò)固定在漁船某個(gè)位置的攝像頭采集,通過(guò)采集甲板上捕獲的魚(yú)類(lèi)照片,共采集到3777張共8個(gè)分類(lèi)的照片作為訓(xùn)練樣本,分別為長(zhǎng)鰭金槍魚(yú)、大眼金槍魚(yú)、黃鰭金槍魚(yú)、鰍魚(yú)、月魚(yú)、鯊魚(yú)、其他、無(wú)魚(yú)類(lèi)(表示沒(méi)有魚(yú)出現(xiàn)在照片里)。按一定比例做分層采樣,其中2984張用作訓(xùn)練集,394張用作驗(yàn)證集,399張用作測(cè)試集。訓(xùn)練集用經(jīng)過(guò)錯(cuò)切幅度值為0.15的仿射變換作數(shù)據(jù)集擴(kuò)增來(lái)降低過(guò)擬合,因?yàn)樵趶脑紨?shù)據(jù)集上分層采樣得來(lái)的小樣本數(shù)據(jù)集上驗(yàn)證顯示當(dāng)錯(cuò)切幅度值等于0.15時(shí),模型在測(cè)試集上的分類(lèi)精度最高。

      在訓(xùn)練集上采用sloth@款圖片標(biāo)注工具手動(dòng)標(biāo)注魚(yú)類(lèi)在圖片中的位置,并把這些標(biāo)注結(jié)果和已有的魚(yú)類(lèi)分類(lèi)標(biāo)注結(jié)果當(dāng)做輸入數(shù)據(jù)和圖片數(shù)據(jù)一起傳給模型訓(xùn)練。

      本次研究的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。卷積層采用了被廣泛使用在圖像分類(lèi)任務(wù)中的VGG模型的卷積濾波器的權(quán)重[3],并在其模型上作微調(diào)來(lái)實(shí)現(xiàn)本次研究的目標(biāo)。

      輸入層將不同尺寸的圖片統(tǒng)一轉(zhuǎn)換成244*244大小。

      匯合層(max pooling)是指取一小塊像素區(qū)域的像素最大值,作用是可減少數(shù)據(jù)量,控制過(guò)擬合。

      全連接層的權(quán)重采用反向傳播算法(back propagation)訓(xùn)練,參數(shù)尋優(yōu)采用隨機(jī)梯度下降方法。動(dòng)態(tài)學(xué)習(xí)率設(shè)定方法采用了 Adam方法,可根據(jù)損失函數(shù)在迭代訓(xùn)練中產(chǎn)生的信息自動(dòng)調(diào)整學(xué)習(xí)率。

      激活層函數(shù)采用RELU方法,公式為。最后一層預(yù)測(cè)魚(yú)類(lèi)分類(lèi)的激活曾需要把對(duì)應(yīng)于各個(gè)分類(lèi)的分?jǐn)?shù)值轉(zhuǎn)換成總和為1的對(duì)應(yīng)于各個(gè)分類(lèi)的概率值,所以激活函數(shù)采用Softmax方法,公式如下

      由于卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)強(qiáng)大的表示能力,為了降低模型的過(guò)擬合以及加快模型的訓(xùn)練速度,本次工作在激活曾后面再依次加入一層dropout層和batch normalization層。dropout層是指隨機(jī)的舍棄一部分激活曾神經(jīng)元的值,并將其置為0[4]。batch normalization層是指規(guī)范化每層激活層的輸出,并加入4個(gè)規(guī)范化參數(shù)來(lái)抑制模型訓(xùn)練過(guò)程中的反規(guī)范化現(xiàn)象[5]。

      2 程序?qū)崿F(xiàn)

      具體的軟件實(shí)現(xiàn)采用python編程語(yǔ)言和keras框架平臺(tái)。keras底層采用輕量易用的theano框架,并依賴(lài)計(jì)算機(jī)的顯卡來(lái)進(jìn)行更快速的訓(xùn)練工作。整個(gè)圖像分類(lèi)的軟件框架主要由4部分組成,分別是輸入圖像數(shù)據(jù)處理、模型各個(gè)網(wǎng)絡(luò)層的實(shí)現(xiàn)及拼接、模型編譯、模型訓(xùn)練及預(yù)測(cè)。下面按數(shù)據(jù)在模型中流動(dòng)的順序具體的闡述各個(gè)部分的程序?qū)崿F(xiàn)。

      2.1 輸入圖像數(shù)據(jù)處理

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程范文第4篇

      關(guān)鍵詞:人機(jī)大戰(zhàn);人工智能;發(fā)展前景

      中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

      0.引言

      2016年3月15日,備受矚目的“人機(jī)大戰(zhàn)”終于落下帷幕,最終Google公司開(kāi)發(fā)的“AlphaGo”以4∶1戰(zhàn)勝了韓國(guó)九段棋手李世h。毫無(wú)疑問(wèn),這是人工智能歷史上一個(gè)具有里程碑式的大事件。大家一致認(rèn)為,人工智能已經(jīng)上升到了一個(gè)新的高度。

      這次勝利與1997年IBM公司的“深藍(lán)”戰(zhàn)勝?lài)?guó)際象棋世界冠軍卡斯帕羅不同。主要表現(xiàn)在兩個(gè)方面:

      (1)AlphaGo的勝利并非僅僅依賴(lài)強(qiáng)悍的計(jì)算能力和龐大的棋譜數(shù)據(jù)庫(kù)取勝,而是AlphaGo已經(jīng)擁有了深度學(xué)習(xí)的能力,能夠?qū)W習(xí)已經(jīng)對(duì)弈過(guò)的棋盤(pán),并在練習(xí)和實(shí)戰(zhàn)中不斷學(xué)習(xí)和積累經(jīng)驗(yàn)。

      (2)圍棋比國(guó)際象棋更加復(fù)雜,圍棋棋盤(pán)有361個(gè)點(diǎn),其分支因子無(wú)窮無(wú)盡,19×19格圍棋的合法棋局?jǐn)?shù)的所有可能性是冪為171的指數(shù),這樣的計(jì)算量相當(dāng)巨大。英國(guó)圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡(jiǎn)單的規(guī)則加深了棋局的復(fù)雜性”。因此,進(jìn)入圍棋領(lǐng)域一直被認(rèn)為是目前人工智能的最大挑戰(zhàn)。

      簡(jiǎn)而言之,AlphaGo取得勝利的一個(gè)很重要的方面就是它擁有強(qiáng)大的“學(xué)習(xí)”能力。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,得益于大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)。本文就從人工智能的發(fā)展歷程與現(xiàn)狀入手,在此基礎(chǔ)上分析了人工智能的未來(lái)發(fā)展前景。

      1.人工智能的發(fā)展歷程

      AlphaGo的勝利表明,人工智能發(fā)展到今天,已經(jīng)取得了很多卓越的成果。但是,其發(fā)展不是一帆風(fēng)順的,人工智能是一個(gè)不斷進(jìn)步,并且至今仍在取得不斷突破的學(xué)科?;仡櫲斯ぶ悄艿陌l(fā)展歷程,可大致分為孕育、形成、暗淡、知識(shí)應(yīng)用和集成發(fā)展五大時(shí)期。

      孕育期:1956年以前,數(shù)學(xué)、邏輯、計(jì)算機(jī)等理論和技術(shù)方面的研究為人工智能的出現(xiàn)奠定了基礎(chǔ)。德國(guó)數(shù)學(xué)家和哲學(xué)家萊布尼茨把形式邏輯符號(hào)化,奠定了數(shù)理邏輯的基礎(chǔ)。英國(guó)數(shù)學(xué)家圖靈在1936年創(chuàng)立了自動(dòng)機(jī)理論(亦稱(chēng)圖靈機(jī)),1950年在其著作《計(jì)算機(jī)與智能》中首次提出“機(jī)器也能思維”,被譽(yù)為“人工智能之父”??傊?,這些人為人工智能的孕育和產(chǎn)生做出了巨大的貢獻(xiàn)。

      形成期:1956年夏季,在美國(guó)達(dá)特茅斯大學(xué)舉辦了長(zhǎng)達(dá)2個(gè)多月的研討會(huì),熱烈地討論用機(jī)器模擬人類(lèi)智能的問(wèn)題。該次會(huì)議首次使用了“人工智能”這一術(shù)語(yǔ)。這是人類(lèi)歷史上第一次人工智能研討會(huì),標(biāo)志著人工智能學(xué)科的誕生。其后的十幾年是人工智能的黃金時(shí)期。在接下來(lái)的幾年中,在眾多科學(xué)家的努力下,人工智能取得了矚目的突破,也在當(dāng)時(shí)形成了廣泛的樂(lè)觀思潮。

      暗淡期:20世紀(jì)70年代初,即使最杰出的AI程序也只能解決問(wèn)題中最簡(jiǎn)單的部分,發(fā)展遇到瓶頸也就是說(shuō)所有的AI程序都只是“玩具”,無(wú)法解決更為復(fù)雜的問(wèn)題。隨著AI遭遇批評(píng),對(duì)AI提供資助的機(jī)構(gòu)也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。

      知識(shí)應(yīng)用期:在80年代,“專(zhuān)家系統(tǒng)”(Expect System)成為了人工智能中一個(gè)非常主流的分支。“專(zhuān)家系統(tǒng)”是一種程序,為計(jì)算機(jī)提供特定領(lǐng)域的專(zhuān)門(mén)知識(shí)和經(jīng)驗(yàn),計(jì)算機(jī)就能夠依據(jù)一組從專(zhuān)門(mén)知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問(wèn)題。不同領(lǐng)域的專(zhuān)家系統(tǒng)基本都是由知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、推理機(jī)、解釋機(jī)制、知識(shí)獲取等部分組成。

      集成發(fā)展期:得益于互聯(lián)網(wǎng)的蓬勃發(fā)展、計(jì)算機(jī)性能的突飛猛進(jìn)、分布式系統(tǒng)的廣泛應(yīng)用以及人工智能多分支的協(xié)同發(fā)展,人工智能在這一階段飛速發(fā)展。尤其是隨著深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)研究的不斷深入,人工智能在近幾十年中取得了長(zhǎng)足的進(jìn)步,取得了令人矚目的成就。

      人工智能發(fā)展到今天,出現(xiàn)了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個(gè)里程碑。當(dāng)前人工智能的研究熱點(diǎn)主要集中在自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

      2.人工智能l展現(xiàn)狀與前景

      人工智能當(dāng)前有很多重要的研究領(lǐng)域和分支。目前,越來(lái)越多的AI項(xiàng)目依賴(lài)于分布式系統(tǒng),而當(dāng)前研究的普遍熱點(diǎn)則集中于自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

      自然語(yǔ)言處理:自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP),是語(yǔ)言學(xué)與人工智能的交叉學(xué)科,其主要功能就是實(shí)現(xiàn)讓機(jī)器明白人類(lèi)的語(yǔ)言,這需要將人類(lèi)的自然語(yǔ)言轉(zhuǎn)化為計(jì)算機(jī)能夠處理的機(jī)器語(yǔ)言。

      自然語(yǔ)言處理主要包括詞法分析、句法分析和語(yǔ)義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對(duì)自然語(yǔ)言中句子的結(jié)構(gòu)、語(yǔ)法進(jìn)行分析如辨別疑問(wèn)句和感嘆句等。而語(yǔ)義分析則注重情感分析和整個(gè)段落的上下文分析,辨別一些字詞在不同的上下文定的語(yǔ)義和情感態(tài)度。

      當(dāng)前自然語(yǔ)言的處理主要有兩大方向。一種是基于句法-語(yǔ)義規(guī)則的理性主義理論,該理論認(rèn)為需要為計(jì)算機(jī)制定一系列的規(guī)則,計(jì)算機(jī)在規(guī)則下進(jìn)行推理與判斷。因此其技術(shù)路線是一系列的人為的語(yǔ)料建設(shè)與規(guī)則制定。第二種是基于統(tǒng)計(jì)學(xué)習(xí)的經(jīng)驗(yàn)主義理論,這種理論在最近受到普遍推崇。該理論讓計(jì)算機(jī)自己通過(guò)學(xué)習(xí)并進(jìn)行統(tǒng)計(jì)推斷的方式不停地從數(shù)據(jù)中“學(xué)習(xí)”語(yǔ)言,試圖刻畫(huà)真實(shí)世界的語(yǔ)言現(xiàn)象,從數(shù)據(jù)中統(tǒng)計(jì)語(yǔ)言的規(guī)律。

      機(jī)器學(xué)習(xí):機(jī)器學(xué)習(xí)(Machine Learning)是近20年來(lái)興起的人工智能一大重要領(lǐng)域。其主要是指通過(guò)讓計(jì)算機(jī)在數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,從而獲取“自我學(xué)習(xí)”的能力,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行判斷和預(yù)測(cè)的方法。

      機(jī)器學(xué)致可以分為有監(jiān)督的學(xué)習(xí)和無(wú)監(jiān)督的學(xué)習(xí)。有監(jiān)督的學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中練出一個(gè)函數(shù)和目標(biāo),當(dāng)有新的數(shù)據(jù)到來(lái)時(shí),可以由訓(xùn)練得到函數(shù)預(yù)測(cè)目標(biāo)。有監(jiān)督的學(xué)習(xí)要求訓(xùn)練集同時(shí)有輸入和輸出,也就是所謂的特征和目標(biāo)。而依據(jù)預(yù)測(cè)的結(jié)果是離散的還是連續(xù)的,將有監(jiān)督的學(xué)習(xí)分為兩大問(wèn)題,即統(tǒng)計(jì)分類(lèi)問(wèn)題和回歸分析問(wèn)題。統(tǒng)計(jì)分類(lèi)的預(yù)測(cè)結(jié)果是離散的,如腫瘤是良性還是惡性等;而回歸分析問(wèn)題目標(biāo)是連續(xù)的,如天氣、股價(jià)等的預(yù)測(cè)。

      無(wú)監(jiān)督學(xué)習(xí)的訓(xùn)練集則沒(méi)有人為標(biāo)注的結(jié)果,這就需要計(jì)算機(jī)去發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系并用來(lái)分類(lèi)等。一種常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)是聚類(lèi)分析(Cluster Analysis),它是將相似的對(duì)象通過(guò)靜態(tài)分類(lèi)的方法分成不同的組別或者是特定的子集,讓同一個(gè)子集中的數(shù)據(jù)對(duì)象都有一些相似的屬性,比較常用的聚類(lèi)方法是簡(jiǎn)潔并快速的“K-均值”聚類(lèi)算法。它基于K個(gè)中心并對(duì)距離這些中心最近的數(shù)據(jù)對(duì)象進(jìn)行分類(lèi)。

      機(jī)器學(xué)習(xí)還包括如半監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)等類(lèi)別。總而言之,機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來(lái)模擬人類(lèi)學(xué)習(xí)活動(dòng)的一門(mén)學(xué)科,而其應(yīng)用隨著人工智能研究領(lǐng)域的深入也變得越來(lái)越廣泛,如模式識(shí)別、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、推薦算法等領(lǐng)域越來(lái)越廣泛地應(yīng)用到了機(jī)器學(xué)習(xí)中。

      人工神經(jīng)網(wǎng)絡(luò):在腦神經(jīng)科學(xué)領(lǐng)域,人們認(rèn)為人類(lèi)的意識(shí)及智能行為,都是通過(guò)巨大的神經(jīng)網(wǎng)絡(luò)傳遞的,每個(gè)神經(jīng)細(xì)胞通過(guò)突出與其他神經(jīng)細(xì)胞連接,當(dāng)通過(guò)突觸的信號(hào)強(qiáng)度超過(guò)某個(gè)閾值時(shí),神經(jīng)細(xì)胞便會(huì)進(jìn)入激活狀態(tài),向所連接的神經(jīng)細(xì)胞一層層傳遞信號(hào)。于1943年提出的基于生物神經(jīng)元的M-P模型的主要思想就是將神經(jīng)元抽象為一個(gè)多輸入單輸出的信息處理單元,并通過(guò)傳遞函數(shù)f對(duì)輸入x1,x2…,xn進(jìn)行處理并模擬神經(jīng)細(xì)胞的激活模式。主要的傳遞函數(shù)有階躍型、線性型和S型。

      在此基礎(chǔ)上,對(duì)神經(jīng)網(wǎng)絡(luò)算法的研究又有諸多進(jìn)展。日本的福島教授于1983年基于視覺(jué)認(rèn)知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型。通過(guò)學(xué)習(xí)訓(xùn)練獲取到卷積運(yùn)算中所使用的卷積系數(shù),并通過(guò)不同層次與自由度的變化,可以得到較為優(yōu)化的計(jì)算結(jié)果。而AlphaGo也正是采用了這種深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型,提高了AlphaGo的視覺(jué)分類(lèi)能力,也就是所謂的“棋感”,增強(qiáng)了其對(duì)全盤(pán)決策和把握的能力。

      3.人工智能的發(fā)展前景

      總體來(lái)看,人工智能的應(yīng)用經(jīng)歷了博弈、感知、決策和反饋這幾個(gè)里程碑。在以上4個(gè)領(lǐng)域中,既是縱向發(fā)展的過(guò)程,也是橫向不斷改進(jìn)的過(guò)程。

      人工智能在博弈階段,主要是實(shí)現(xiàn)邏輯推理等功能,隨著計(jì)算機(jī)處理能力的進(jìn)步以及深度學(xué)習(xí)等算法的改進(jìn),機(jī)器擁有了越來(lái)越強(qiáng)的邏輯與對(duì)弈能力。在感知領(lǐng)域,隨著自然語(yǔ)言處理的進(jìn)步,機(jī)器已經(jīng)基本能對(duì)人類(lèi)的語(yǔ)音與語(yǔ)言進(jìn)行感知,并且能夠已經(jīng)對(duì)現(xiàn)實(shí)世界進(jìn)行視覺(jué)上的感知。基于大數(shù)據(jù)的處理和機(jī)器學(xué)習(xí)的發(fā)展,機(jī)器已經(jīng)能夠?qū)χ車(chē)沫h(huán)境進(jìn)行認(rèn)知,例如微軟的Kinect就能夠準(zhǔn)確的對(duì)人的肢體動(dòng)作進(jìn)行判斷。該領(lǐng)域的主要實(shí)現(xiàn)還包括蘋(píng)果的Siri,谷歌大腦以及無(wú)人駕駛汽車(chē)中的各種傳感器等。在以上兩個(gè)階段的基礎(chǔ)上,機(jī)器擁有了一定的決策和反饋的能力。無(wú)人駕駛汽車(chē)的蓬勃發(fā)展就是這兩個(gè)里程碑很好的例證。Google的無(wú)人駕駛汽車(chē)通過(guò)各種傳感器對(duì)周?chē)沫h(huán)境進(jìn)行感知并處理人類(lèi)的語(yǔ)言等指令,利用所收集的信息進(jìn)行最后的決策,比如操作方向盤(pán)、剎車(chē)等。

      人工智能已經(jīng)滲透到生活中的各個(gè)領(lǐng)域。機(jī)器已經(jīng)能識(shí)別語(yǔ)音、人臉以及視頻內(nèi)容等,從而實(shí)現(xiàn)各種人際交互的場(chǎng)景。在醫(yī)學(xué)領(lǐng)域,人工智能可以實(shí)現(xiàn)自動(dòng)讀片和輔助診斷以及個(gè)性化t療和基因排序等功能。在教育領(lǐng)域,機(jī)器也承擔(dān)了越來(lái)越多的輔助教育,智能交互的功能。在交通領(lǐng)域,一方面無(wú)人車(chē)的發(fā)展表明無(wú)人駕駛是一個(gè)可以期待的未來(lái),另一方面人工智能能夠帶來(lái)更加通暢和智能的交通。另外人工智能在安防、金融等領(lǐng)域也有非常廣闊的發(fā)展前景。總之,人工智能在一些具有重復(fù)性的和具備簡(jiǎn)單決策的領(lǐng)域已經(jīng)是一種非常重要的工具,用來(lái)幫助人們解決問(wèn)題,創(chuàng)造價(jià)值。

      參考文獻(xiàn)

      [1]阮曉東.從AlphaGo的勝利看人工智能的未來(lái)[J].新經(jīng)濟(jì)導(dǎo)刊,2016 (6):69-74.

      卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程范文第5篇

      人工智能的概念已提出60年,從原來(lái)的理論框架體系的搭建,到實(shí)驗(yàn)室關(guān)鍵技術(shù)的準(zhǔn)備,如今已開(kāi)始進(jìn)入全新的發(fā)展階段――產(chǎn)業(yè)化。

      目前,從基本的算法到腦科學(xué)研究,人工智能都還沒(méi)有突破性進(jìn)展的可能性。但是,以深度神經(jīng)網(wǎng)絡(luò)為代表的人工智能,結(jié)合日新月異的大數(shù)據(jù)、云計(jì)算和移動(dòng)互聯(lián)網(wǎng),就可以在未來(lái)5到10年改變我們的世界。

      人工智能+時(shí)代的兩大機(jī)遇

      人工智能不僅將替代簡(jiǎn)單重復(fù)的勞動(dòng),還將替代越來(lái)越多的復(fù)雜的高級(jí)腦力活動(dòng),創(chuàng)造一個(gè)個(gè)新的機(jī)會(huì)。可以說(shuō),任何一個(gè)行業(yè)、企業(yè)或今天的創(chuàng)業(yè)者,如果不用人工智能改變今天的生產(chǎn)和生活方式,5年后一定會(huì)出局。

      第一個(gè)趨勢(shì)是以語(yǔ)音為主導(dǎo)、以鍵盤(pán)和觸摸為輔助的人機(jī)交互時(shí)代正在到來(lái)。如今越來(lái)越多的設(shè)備不再需要屏幕,越來(lái)越多的場(chǎng)景我們不用直接碰觸。比如,想把燈光調(diào)亮,想打開(kāi)五米之外的設(shè)備,我們的手沒(méi)法直接觸碰。再如,開(kāi)車(chē)時(shí)不方便用手、用眼做其他事情。這時(shí),語(yǔ)音就成為最主要的一個(gè)交互方式。

      第二個(gè)趨勢(shì)是人工智能正在全球范圍內(nèi)掀起一股浪潮,“人工智能+”的時(shí)代到來(lái),而且會(huì)比我們想象的還要快。為什么呢?麥肯錫分析認(rèn)為,當(dāng)前45%的工作可以被技術(shù)自動(dòng)化,不只是簡(jiǎn)單重復(fù)性的工作,CEO20%的工作也可以被機(jī)器取代?!犊茖W(xué)》雜志預(yù)測(cè),2045年人工智能會(huì)顛覆全球50%、中國(guó)77%的就業(yè)。也就是說(shuō),今天的我們3/4的工作30年后會(huì)被人工智能取代。埃森哲認(rèn)為,到2035年人工智能會(huì)讓12個(gè)發(fā)達(dá)國(guó)家經(jīng)濟(jì)增長(zhǎng)率翻一倍。我國(guó)的增長(zhǎng)率只有比這還高,才對(duì)得起今天的時(shí)代機(jī)遇。

      從科大訊飛的情況可以看出,人工智能將迎來(lái)兩大產(chǎn)業(yè)機(jī)遇。

      第一,未來(lái)3到5年,萬(wàn)物互聯(lián)的時(shí)代到來(lái),以語(yǔ)音為主、鍵盤(pán)觸摸為輔的人機(jī)交互將廣泛應(yīng)用。第二,未來(lái)5到10年,人工智能會(huì)像水和電一樣進(jìn)入各行各業(yè),深刻改變我們的生活。

      認(rèn)知智能是最大技術(shù)瓶頸

      人工智能技術(shù)有兩種分類(lèi)方法。一種分為強(qiáng)人工智能和弱人工智能;另一種是訊飛研究院提出的、跟技術(shù)演進(jìn)路徑相關(guān)的分類(lèi),分成計(jì)算智能、感知智能和認(rèn)知智能。

      計(jì)算智能就是機(jī)器能存會(huì)算。就像當(dāng)年IBM的深藍(lán)電腦下象棋超過(guò)卡斯帕羅夫,典型的就是因?yàn)檫\(yùn)算能力強(qiáng),提前算到了所有的結(jié)果。

      感知智能,比如語(yǔ)音合成技術(shù),能夠讓機(jī)器開(kāi)口說(shuō)話。再如語(yǔ)音識(shí)別技術(shù),就像今天的演講,后臺(tái)系統(tǒng)把它變成文字,準(zhǔn)確率可達(dá)95%。

      認(rèn)知智能是讓機(jī)器具備能理解、會(huì)思考的能力。這是最大的挑戰(zhàn),也是大家最熱切期待的技術(shù)突破。工業(yè)革命讓我們從繁重的體力勞動(dòng)中解放出來(lái),未來(lái)的認(rèn)知智能會(huì)讓人從今天很多復(fù)雜的腦力勞動(dòng)中解放出來(lái)。

      科大訊飛選擇以語(yǔ)音為入口解決認(rèn)知難題,進(jìn)行認(rèn)知革命。以人機(jī)交互為入口的目的,就是為了解決自然語(yǔ)言理解的技術(shù)難題。這個(gè)入口可以把人類(lèi)的智慧最便捷地匯聚到后臺(tái),供機(jī)器學(xué)習(xí)和訓(xùn)練,也可以使后臺(tái)人工智能的成果最簡(jiǎn)單直接地輸出,從社會(huì)不斷取得它學(xué)習(xí)需要的反饋信息,在此基礎(chǔ)上實(shí)現(xiàn)知識(shí)管理和推理學(xué)習(xí)。

      科大訊飛承擔(dān)的科技部第一個(gè)人工智能重大專(zhuān)項(xiàng)――高考機(jī)器人。目標(biāo)是為了“考大學(xué)”,但其核心技術(shù)正是語(yǔ)言理解、知識(shí)表達(dá)、聯(lián)想推理和自主學(xué)習(xí)。

      人工智能技術(shù)正走向產(chǎn)業(yè)化

      目前,科大訊飛的人工智能研究已經(jīng)取得了階段性成果。

      在教育行業(yè),科大訊飛的機(jī)器人通過(guò)構(gòu)建學(xué)生全過(guò)程的學(xué)習(xí)數(shù)據(jù)和老師上課的數(shù)據(jù),提升了課堂效率,原來(lái)45分鐘的課堂,現(xiàn)在15分鐘就搞定。因?yàn)榇罅康膬?nèi)容學(xué)生都是知道的,老師只需向個(gè)別沒(méi)掌握的學(xué)生單獨(dú)講授。這樣,老師就有時(shí)間把課堂的重點(diǎn)放在大家都不了解的知識(shí)上,學(xué)生可以用大量時(shí)間進(jìn)行啟發(fā)式學(xué)習(xí)。借助這些手段,學(xué)生的重復(fù)性訓(xùn)練可以降低50%以上。

      在醫(yī)療行業(yè),科大訊飛利用語(yǔ)音解決門(mén)診電子病歷,利用人工智能輔助診療。學(xué)習(xí)最頂尖醫(yī)療專(zhuān)家知識(shí)后的人工智能產(chǎn)品,可以超過(guò)一線全科醫(yī)生的水平。當(dāng)前,醫(yī)療行業(yè)一線最缺的是全科醫(yī)生和兒科醫(yī)生,引入人工智能技術(shù)就可以緩解醫(yī)療資源短缺壓力。

      科大訊飛的人工智能技術(shù)還應(yīng)用在汽車(chē)領(lǐng)域。在寶馬汽車(chē)去年的國(guó)際測(cè)試中,科大訊飛以86%的準(zhǔn)確率名列第一。

      在客服領(lǐng)域,機(jī)器已經(jīng)替代掉了30%的人工服務(wù)。目前,安徽移動(dòng)呼叫中心有75%的服務(wù)內(nèi)容已被機(jī)器替代。

      機(jī)器人還將從服務(wù)后臺(tái)走向前端。今年第四季度末或明年,服務(wù)機(jī)器人將開(kāi)始在銀行和電信營(yíng)業(yè)廳上崗工作,它們不僅好玩、有趣,吸引人氣,還能幫客戶解決實(shí)際問(wèn)題。

      1000部夫妻午夜免费| 久久国产精品一区av瑜伽| 在线麻豆精东9制片厂av影现网 | 国产精品日本中文在线| 在线视频中文字幕一区二区三区| 国产在线精品一区二区中文| 久久亚洲sm情趣捆绑调教| 久久久久国产精品四虎| av一区二区在线网站| 24小时日本在线视频资源| 成 人 色综合 综合网站| 亚洲一区二区情侣| 国产乱淫h侵犯在线观看| 亚洲精品美女久久777777| 亚洲狠狠婷婷综合久久| 中文字幕有码高清| 国语对白精品在线观看| 精品无码av一区二区三区| 国产一级做a爱免费观看| 国产一区二区在线观看视频免费 | 久久久久亚洲av无码专区网站| 极品诱惑一区二区三区| 国产精品髙潮呻吟久久av| 国产亚洲精品成人aa片新蒲金| 国产精品久久无码一区二区三区网| 国产AV秘 无码一区二区三区| 日本a级黄片免费观看| 亚洲av综合永久无码精品天堂| 亚洲大尺度在线观看| 女同视频网站一区二区| 日韩欧美一区二区三区免费观看| 人妻少妇精品专区性色av| 亚洲一区二区高清精品| 蜜臀av在线一区二区尤物| 日日天干夜夜狠狠爱| 欧美日韩在线观看免费| 亚洲一区二区女优视频| 久久人人爽人人爽人人片av高请| 中文字幕日本最新乱码视频| 亚洲日日噜噜噜夜夜爽爽| 在教室轮流澡到高潮h免费视|