柚子快報(bào)邀請(qǐng)碼778899分享:機(jī)器學(xué)習(xí)發(fā)展歷程及其分類綜述
柚子快報(bào)邀請(qǐng)碼778899分享:機(jī)器學(xué)習(xí)發(fā)展歷程及其分類綜述
目錄
1 機(jī)器學(xué)習(xí)的概念
1.1學(xué)習(xí)的概念
1.2機(jī)器學(xué)習(xí)的概念
2 國內(nèi)外研究成果
2.1國內(nèi)研究成果:
2.1.1泛化能力的研究
2.1.2機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應(yīng)用
2.2.3人工智能原理在人類學(xué)習(xí)中的應(yīng)用
2.2國外研究成果:
2.2.1搜索引擎Google的成功,使得Internet搜索引擎成為新興產(chǎn)業(yè)
2.2.2基于機(jī)器學(xué)習(xí)的入侵檢測(cè)技術(shù)
3 理論發(fā)展動(dòng)態(tài)
4 機(jī)器學(xué)習(xí)的分類
4.1 監(jiān)督學(xué)習(xí)
4.2無監(jiān)督學(xué)習(xí)
4.2.1聚類分析
4.2.2數(shù)據(jù)降維
4.3半監(jiān)督學(xué)習(xí)
4.4強(qiáng)化學(xué)習(xí)
1 機(jī)器學(xué)習(xí)的概念
1.1學(xué)習(xí)的概念
????????學(xué)習(xí)是一個(gè)人們習(xí)以為常的概念,但究竟什么是學(xué)習(xí),至今仍無一個(gè)統(tǒng)一的定義。在各種不同的學(xué)習(xí)觀點(diǎn)中,影響最大的有以下幾種:
????????(1)西蒙(Simon,1983 年)認(rèn)為,學(xué)習(xí)就是系統(tǒng)中的適應(yīng)性變化,這種變化使系統(tǒng)在重復(fù)同樣工作或類似工作時(shí),能夠做得更好。
????????(2)明斯基(Minsky,1985 年)認(rèn)為,學(xué)習(xí)是在人們頭腦里(心理內(nèi)部)有用的變化。
????????(3)米哈爾斯基(Michalski,1986 年)認(rèn)為,學(xué)習(xí)是對(duì)經(jīng)歷描述的建立和修改[1]。這些觀點(diǎn)雖然不盡相同,但卻都包含了知識(shí)獲取和能力改善這兩個(gè)主要方面。
1.2機(jī)器學(xué)習(xí)的概念
????????機(jī)器學(xué)習(xí)是定義在學(xué)習(xí)之上的,由于對(duì)學(xué)習(xí)目前尚無嚴(yán)格定義,因此對(duì)機(jī)器學(xué)習(xí)也不可能給出一個(gè)嚴(yán)格的定義。從直觀上理解,機(jī)器學(xué)習(xí)就是讓機(jī)器(計(jì)算機(jī))來模擬人類的學(xué)習(xí)功能,它是一門研究怎樣用機(jī)器來模擬或?qū)崿F(xiàn)人類學(xué)習(xí)活動(dòng)的一門學(xué)科。它是人工智能中最具有智能特征的前沿研究領(lǐng)域之一。
????????最早的機(jī)器學(xué)習(xí)算法可以追溯到20世紀(jì)初,到今天為止,已經(jīng)過去了100多年??傮w上,機(jī)器學(xué)習(xí)算法可以分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)4種類型。
2 國內(nèi)外研究成果
2.1國內(nèi)研究成果:
????????近年來, 國內(nèi)對(duì)有關(guān)機(jī)器學(xué)習(xí)的研究發(fā)展較快, 主要表現(xiàn)在以下幾個(gè)方面。
1. 泛化能力的研究
????????機(jī)器學(xué)習(xí)所關(guān)注的一個(gè)根本問題是如何提高學(xué)習(xí)系統(tǒng)的泛化能力, 或也就是機(jī)器在數(shù)據(jù)中發(fā)現(xiàn)的模式怎樣才能具有良好的推廣能力。 南京大學(xué)周志華教授長期從事人工智能中機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別等方面的研究, 他的研究組在集成學(xué)習(xí)領(lǐng)域進(jìn)行了深入研究,并設(shè)計(jì)出有效的選擇性集成算法[2]。理想的學(xué)習(xí)方法不僅要有強(qiáng)的泛化能力, 還要有好的可理解性。 周志華等人提出了二次學(xué)習(xí)的思想, 將集成學(xué)習(xí)用作預(yù)處理, 設(shè)計(jì)出泛化能力強(qiáng)、可理解性好的新型規(guī)則學(xué)習(xí)方法C4.5Rule-PANE,引起著名學(xué)者Sharkey的重視[3]。
2. 機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應(yīng)用
????????數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),是近年來隨著數(shù)據(jù)庫和人工智能技術(shù)的發(fā)展而出現(xiàn)的新興研究領(lǐng)域,它主要是利用機(jī)器學(xué)習(xí)的方法從數(shù)據(jù)庫中提取出有用的知識(shí)。 數(shù)據(jù)挖掘是20世紀(jì)80 年代投資人工智能研究項(xiàng)目失敗后,人工智能轉(zhuǎn)入實(shí)際應(yīng)用時(shí)提出的,它是一個(gè)新興的、面向商業(yè)應(yīng)用的交叉學(xué)科。數(shù)據(jù)挖掘的主要方法為統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法。在數(shù)據(jù)挖掘領(lǐng)域,機(jī)器學(xué)習(xí)方法以其強(qiáng)大的處理不同類型數(shù)據(jù)的能力和商業(yè)應(yīng)用的巨大潛力,受到該領(lǐng)域?qū)W術(shù)界和商業(yè)界越來越多的重視[4]。
3. 人工智能原理在人類學(xué)習(xí)中的應(yīng)用
????????人類認(rèn)知活動(dòng)的最高層次是思維策略,中間一層是初級(jí)信息處理,最底層是生理過程,即中樞神經(jīng)系統(tǒng)、神經(jīng)元和大腦的活動(dòng);與此相對(duì)應(yīng)的是計(jì)算機(jī)的程序、計(jì)算機(jī)語言和硬件。研究認(rèn)知過程的主要任務(wù)是探求高層思維決策與初級(jí)信息處理的關(guān)系,應(yīng)用計(jì)算機(jī)程序模擬人的思維策略水平,用計(jì)算機(jī)語言模擬人的初級(jí)信息處理過程。 計(jì)算機(jī)也用類似的原理進(jìn)行工作。在規(guī)定時(shí)間內(nèi),計(jì)算機(jī)存儲(chǔ)的記憶相當(dāng)于機(jī)體的狀態(tài),計(jì)算機(jī)的輸入相當(dāng)于機(jī)體施加的某種刺激。在得到輸入后,計(jì)算機(jī)便進(jìn)行操作,使其內(nèi)部狀態(tài)發(fā)生變化,由此產(chǎn)生了機(jī)器學(xué)習(xí)理論[5]。
2.2國外研究成果:
1.搜索引擎Google的成功,使得Internet搜索引擎成為新興產(chǎn)業(yè)
????????除了現(xiàn)有的眾多專營搜索引擎的公司( 如專門針對(duì)中文搜索的就有慧聰、百度等) ,Microsoft 等巨頭也開始投入巨資進(jìn)行搜索引擎的研發(fā)。Google掘到的第一桶金,來源于其創(chuàng)始人Larry Page和Sergey Brin提出的PageRank算法。機(jī)器學(xué)習(xí)技術(shù)正在支撐著各類搜索引擎(尤其是貝葉斯學(xué)習(xí)技術(shù)) [6]。
2. 基于機(jī)器學(xué)習(xí)的入侵檢測(cè)技術(shù)
????????傳統(tǒng)的入侵檢測(cè)系統(tǒng)IDS存在大量的問題: 對(duì)未知網(wǎng)絡(luò)攻擊的檢測(cè)能力差, 誤報(bào)率高,占用資源多;對(duì)攻擊數(shù)據(jù)的關(guān)聯(lián)和分析功能不足,導(dǎo)致過多的人工參與;對(duì)于現(xiàn)在廣泛使用的腳本攻擊防御能力差等。為了在現(xiàn)代高帶寬、大規(guī)模網(wǎng)絡(luò)環(huán)境下提高入侵檢測(cè)的效率,降低漏報(bào)率和誤報(bào)率,將機(jī)器學(xué)習(xí)方法引入到IDS 中來并采用先進(jìn)的分布式體系結(jié)構(gòu),已成為IDS的重要發(fā)展方向[7]。
3 理論發(fā)展動(dòng)態(tài)
????????機(jī)器學(xué)習(xí)是人工智能領(lǐng)域中較為年輕的分支,其發(fā)展過程可分為4 個(gè)時(shí)期:
????????1)20 世紀(jì)50 年代中期到60 年代中期,屬于熱烈時(shí)期;這一時(shí)期產(chǎn)生了最早的人工神經(jīng)網(wǎng)絡(luò),赫布學(xué)習(xí)規(guī)則,圖靈測(cè)試等一系列標(biāo)志性事件,也標(biāo)志著機(jī)器學(xué)習(xí)這一概念的誕生;
????????2)60 年代中期至70 年代中期,被稱為機(jī)器學(xué)習(xí)的冷靜時(shí)期;這一時(shí)期機(jī)器學(xué)習(xí)的理論研究相對(duì)超前,產(chǎn)生了 KNN 最鄰近算法 (the Nearest Neighbor Algorithm),決策樹算法,BP 和 MLP 神經(jīng)網(wǎng)絡(luò)算法等,但相比理論研究,計(jì)算機(jī)硬件的發(fā)展則相對(duì)緩慢,不能很好地將理論研究轉(zhuǎn)化為實(shí)際應(yīng)用,在一定程度上限制了機(jī)器學(xué)習(xí)的發(fā)展;
????????3)70 年代中期至80 年代中期,稱為復(fù)興時(shí)期,這一時(shí)期,出現(xiàn)了自訓(xùn)練(Self-Training)、直推學(xué)習(xí)(Transductive Learning)、生成式模型(Generative Model)等學(xué)習(xí)方法。
????????4)1986 年開始是機(jī)器學(xué)習(xí)的最新階段,隨著計(jì)算機(jī)硬件性能的飛速發(fā)展,計(jì)算機(jī)運(yùn)算速度在集成電路不斷發(fā)展的助推下,有了質(zhì)的飛躍?;ヂ?lián)網(wǎng)產(chǎn)業(yè)的崛起則為機(jī)器學(xué)習(xí)插上了新的翅膀,大量的數(shù)據(jù)為機(jī)器學(xué)習(xí)的分析研究提供了理論基礎(chǔ)。這一時(shí)期,涌現(xiàn)了 Boosting 算法、SVM 向量機(jī)算法、隨機(jī)森林算法、深度學(xué)習(xí)(Deep Leaning)等,而深藍(lán)人機(jī)國際象棋大賽和AlphaGo人機(jī)圍棋大戰(zhàn)的出現(xiàn),使得人們對(duì)機(jī)器學(xué)習(xí)有了更加清晰的認(rèn)識(shí),機(jī)器學(xué)習(xí)自此走出了瓶頸期,邁上了新的發(fā)展階段。
4 機(jī)器學(xué)習(xí)的分類
4.1 監(jiān)督學(xué)習(xí)
????????監(jiān)督學(xué)習(xí),又稱為又教師學(xué)習(xí),可以理解為有教師教機(jī)器的學(xué)習(xí)過程,說的專業(yè)點(diǎn)就是有數(shù)據(jù)標(biāo)簽,“標(biāo)簽”就是教師,監(jiān)督學(xué)習(xí)輸入數(shù)據(jù)中有導(dǎo)師信號(hào),以概率函數(shù)、代數(shù)函數(shù)或人工神經(jīng)網(wǎng)絡(luò)為基函數(shù)模型,采用迭代計(jì)算方法,學(xué)習(xí)結(jié)果為函數(shù)[8]。監(jiān)督學(xué)習(xí)主要包括分類和回歸。當(dāng)輸出被限制為有限的一組值(離散數(shù)值)時(shí)使用分類算法;當(dāng)輸出可以具有范圍內(nèi)的任何數(shù)值(連續(xù)數(shù)值)時(shí)使用回歸算法。相似度學(xué)習(xí)是與分類和回歸都密切相關(guān)的一類監(jiān)督機(jī)器學(xué)習(xí),它的目標(biāo)是使用相似性函數(shù)從樣本中學(xué)習(xí),這個(gè)函數(shù)可以度量兩個(gè)對(duì)象之間的相似度或關(guān)聯(lián)度。它在排名、推薦系統(tǒng)、視覺識(shí)別跟蹤、人臉識(shí)別等方面有很好的應(yīng)用場(chǎng)景。
4.2無監(jiān)督學(xué)習(xí)
????????無監(jiān)督學(xué)習(xí),就是自己學(xué)自己的,自己歸納數(shù)據(jù)中的知識(shí),沒有老師教,沒有數(shù)據(jù)標(biāo)簽。輸入數(shù)據(jù)中無老師信號(hào),采用聚類方法,學(xué)習(xí)結(jié)果為類別。典型的無導(dǎo)師學(xué)習(xí)有發(fā)現(xiàn)學(xué)習(xí)、聚類、競爭學(xué)習(xí)等[8]。
4.2.1聚類分析
????????聚類分析的早期研究始于 60 年前——K-means算法的出現(xiàn),它最初在1955年由Steinhaus提出,隨后Stuart Lloyd 在 1957 年提出K-均值聚類算法。隨后其一直受到青睞,并延伸出了凝聚分層算法(agglomerative hierarchical algorithm)和基于密度的空間聚類(Density-Based Spatial Clustering of Applications with Noise/DBSCAN)等。主成分分析(PCA)則由卡爾·皮爾遜于1901年發(fā)明,用于分析數(shù)據(jù)及建立數(shù)理模型。1930s由哈羅德·霍特林演進(jìn)并命名。這也是一種十分成熟并且常用的無監(jiān)督算法。
4.2.2數(shù)據(jù)降維
????????數(shù)據(jù)降維在機(jī)器學(xué)習(xí)領(lǐng)域沒有出現(xiàn)太多重量級(jí)的成果。直到1998年,核PCA作為非線性降維算法的出現(xiàn)。這是核技術(shù)的又一次登臺(tái),與PCA的結(jié)合將PCA改造成了非線性的降維算法。
4.3半監(jiān)督學(xué)習(xí)
????????半監(jiān)督學(xué)習(xí),有的數(shù)據(jù)有標(biāo)簽,有的數(shù)據(jù)沒有標(biāo)簽。顧名思義,半監(jiān)督學(xué)習(xí)(Semi-Supervised Learning, SSL)便是介于前兩者之間的學(xué)習(xí)范式,具體表現(xiàn)為當(dāng)可供分析的樣本數(shù)據(jù)總量充足,但有標(biāo)簽數(shù)據(jù)占比極低時(shí),研究人員并不能通過監(jiān)督學(xué)習(xí)構(gòu)建起一個(gè)能夠正確映射、分析能力強(qiáng)的學(xué)習(xí)器,若選擇將占比較大的無標(biāo)簽數(shù)據(jù)通過人工或?qū)<倚畔⒔o出正確標(biāo)注,則會(huì)耗費(fèi)過多的資源,同時(shí)影響到正在進(jìn)行的任務(wù)的時(shí)效性,得不償失,此時(shí)便可以采用折中方案,即在利用有限的有標(biāo)簽數(shù)據(jù)建立相關(guān)映射的基礎(chǔ)之上,充分挖掘大量無標(biāo)簽數(shù)據(jù)所蘊(yùn)含的特征分布,以此來彌補(bǔ)有標(biāo)簽數(shù)據(jù)數(shù)量的缺失,以達(dá)成在不借助外界資源的條件下建立學(xué)習(xí)器的目標(biāo)[9]。
4.4強(qiáng)化學(xué)習(xí)
????????強(qiáng)化學(xué)習(xí),算法根據(jù)當(dāng)前的環(huán)境狀態(tài)確定一個(gè)動(dòng)作來執(zhí)行,然后進(jìn)入下一個(gè)狀態(tài),如此反復(fù),目標(biāo)是讓得到的收益最大化。如圍棋游戲就是典型的強(qiáng)化學(xué)習(xí)問題,在每個(gè)時(shí)刻,要根據(jù)當(dāng)前的棋局決定在什么地方落棋,然后進(jìn)行下一個(gè)狀態(tài),反復(fù)的放置棋子,直到贏得或者輸?shù)舯荣?。這里的目標(biāo)是盡可能的贏得比賽,以獲得最大化的獎(jiǎng)勵(lì)。強(qiáng)化學(xué)習(xí)在機(jī)器學(xué)習(xí)領(lǐng)域的起步更晚。雖然早在1980年代就出現(xiàn)了時(shí)序差分算法[10],但對(duì)于很多實(shí)際問題,我們無法用表格的形式列舉出所有的狀態(tài)和動(dòng)作,因此這些抽象的算法無法大規(guī)模實(shí)用。
????????神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)的結(jié)合,即深度強(qiáng)化學(xué)習(xí),才為強(qiáng)化學(xué)習(xí)帶來了真正的機(jī)會(huì)。在這里,深度神經(jīng)網(wǎng)絡(luò)被用于擬合動(dòng)作價(jià)值函數(shù)即Q函數(shù),或者直接擬合策略函數(shù),這使得我們可以處理各種復(fù)雜的狀態(tài)和環(huán)境,在圍棋、游戲、機(jī)器人控制等問題上真正得到應(yīng)用[11]。神經(jīng)網(wǎng)絡(luò)可以直接根據(jù)游戲畫面,自動(dòng)駕駛汽車的攝像機(jī)傳來的圖像,當(dāng)前的圍棋棋局,預(yù)測(cè)出需要執(zhí)行的動(dòng)作。其典型的代表是DQN這樣的用深度神經(jīng)網(wǎng)絡(luò)擬合動(dòng)作價(jià)值函數(shù)的算法,以及直接優(yōu)化策略函數(shù)的算法。
參考文獻(xiàn)
[1] 崔梓凝.機(jī)器學(xué)習(xí)研究領(lǐng)域的研究態(tài)勢(shì)[J].電子技術(shù)與軟件工程,2021,No.211(17):202-203.
[2] 國家自然科學(xué)基金委員會(huì). 國家杰出青年科學(xué)基金獲得者及創(chuàng)新研究群體學(xué)術(shù)帶頭人選介[EBYOL]. (2004- 03-01)[2006- 06- 12].http : ∥www.nsfc.gov. cn YnsfcYcen YndbgY2004ndbgY03Y010.html.
[3] 國家自然科學(xué)基金委員會(huì). 國家杰出青年科學(xué)基金獲得者及創(chuàng)新研究群體學(xué)術(shù)帶頭人選介[EBYOL]. (2004- 03-01)[2006- 06- 12].http : ∥www.nsfc.gov. cn YnsfcYcen YndbgY2004ndbgY03Y010.htm.
[4] 黃林軍, 張勇, 郭冰榕.機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應(yīng)用[J].中山大學(xué)學(xué)報(bào): 自然科學(xué)版, 2005(6): 145- 148.
[5] 張震, 王文發(fā). 人工智能原理在人類學(xué)習(xí)中的應(yīng)用[J]. 吉首大學(xué)學(xué)報(bào): 自然科學(xué)版, 2006(1) : 39- 42.
[6] 周志華. 機(jī)器學(xué)習(xí)的研究[C ]∥ 國家自然科學(xué)基金委員會(huì)信息科學(xué)部AI 戰(zhàn)略研討會(huì)文集. 北京: 國家自然科學(xué)基金委員會(huì)信息科學(xué)部, 2006 : 9- 19.
[7] 張義榮, 肖順平, 鮮明, 等. 基于機(jī)器學(xué)習(xí)的入侵檢測(cè)技術(shù)概述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2006(2) : 7- 10.
[8] 陳海虹,黃彪,劉峰,陳文國.機(jī)器學(xué)習(xí)原理及應(yīng)用[M].成都:電子科技大學(xué)出版社,2017:2-19
[9]李永國,徐彩銀,湯璇等.半監(jiān)督學(xué)習(xí)方法研究綜述[J].世界科技研究與發(fā)展,2023,45(01):26-40.DOI:10.16507/j.issn.1006-6055.2022.07.001.
[10]趙婷婷,韓雅杰,楊夢(mèng)楠等.基于機(jī)器學(xué)習(xí)的時(shí)序數(shù)據(jù)預(yù)測(cè)方法研究綜述[J].天津科技大學(xué)學(xué)報(bào),2021,36(05):1-9.DOI:10.13364/j.issn.1672-6510.20200203.
[11] 徐洪學(xué),孫萬有,杜英魁等.機(jī)器學(xué)習(xí)經(jīng)典算法及其應(yīng)用研究綜述[J].電腦知識(shí)與技術(shù),2020,16(33):17-19.DOI:10.14004/j.cnki.ckt.2020.3359.
柚子快報(bào)邀請(qǐng)碼778899分享:機(jī)器學(xué)習(xí)發(fā)展歷程及其分類綜述
精彩文章
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。