品牌:GE | 規格:全新 | 材質:原裝 |
產地:國外 |
ICP DAS USAI-7080B
綜合分類
綜合考慮各種學習方法出現的歷史淵源、知識表示、推理策略、結果評估的相似性、研究人員交流的相對集中性以及應用領域等諸因素。將機器學習方法區分為以下六類:
1)經驗性歸納學習(empirical inductive learning)。
經驗性歸納學習採用一些數據密集的經驗方法(如版本空間法、ID3法,定律發現方法)對例子進行歸納學習。其例子和學習結果一般都採用屬性、謂詞、關係等符號表示。它相當於基於學習策略分類中的歸納學習,但扣除聯接學習、遺傳算法、加強學習的部分。
2)分析學習(analytic??learning)。
分析學習方法是從一個或少數幾個實例出發,運用領域知識進行分析。其主要特徵為:
·推理策略主要是演繹,而非歸納;
·使用過去的問題求解經驗(實例)指導新的問題求解,或產生能更有效地運用領域知識的搜索控制規則。
分析學習的目標是改善係統的性能,而不是新的概念描述。分析學習包括應用解釋學習、演繹學習、多級結構組塊以及宏操作學習等技術。
3)類比學習。
它相當於基於學習策略分類中的類比學習。目前,在這一類型的學習中比較引人注目的研究是通過與過去經歷的具體事例作類比來學習,稱為基於範例的學習(case_based learning),或簡稱範例學習。
4)遺傳算法(genetic??algorithm)。
遺傳算法模擬生物繁殖的突變、交換和達爾文的自然選擇(在每一生態環境中適者生存)。它把問題可能的解編碼為一個向量,稱為個體,向量的每一個元素稱為基因,並利用目標函數(相應於自然選擇標準)對群體(個體的集合)中的每一個個體進行評價,根據評價值(適應度)對個體進行選擇、交換、變異等遺傳操作,從而得到新的群體。遺傳算法適用於非常復雜和困難的環境,比如,帶有大量噪聲和無關數據、事物不斷更新、問題目標不能明顯和地定義,以及通過很長的執行過程才能確定當前行為的價值等。同神經網絡一樣,遺傳算法的研究已經發展為人工智能的一個獨立分支,其代表人物為霍勒德(J.H.Holland)。
5)聯接學習。
典型的聯接模型實現為人工神經網絡,其由稱為神經元的一些簡單計算單元以及單元間的加權聯接組成。
6)加強學習(reinforcement learning)。
加強學習的特點是通過與環境的試探性(trial and error)交互來確定和優化動作的選擇,以實現所謂的序列決策任務。在這種任務中,學習機制通過選擇並執行動作,導致係統狀態的變化,並有可能得到某種強化信號(立即回報),從而實現與環境的交互。強化信號就是對係統行為的一種標量化的獎懲。係統學習的目標是尋找一個合適的動作選擇策略,即在任一給定的狀態下選擇哪種動作的方法,使產生的動作序列可獲得某種優的結果(如累計立即回報大)。
在綜合分類中,經驗歸納學習、遺傳算法、聯接學習和加強學習均屬於歸納學習,其中經驗歸納學習採用符號表示方式,而遺傳算法、聯接學習和加強學習則採用亞符號表示方式;分析學習屬於演繹學習。
實際上,類比策略可看成是歸納和演繹策略的綜合。因而基本的學習策略只有歸納和演繹。
從學習內容的角度看,採用歸納策略的學習由於是對輸入進行歸納,所學習的知識顯然超過原有係統知識庫所能蘊涵的範圍,所學結果改變了係統的知識演繹閉包,因而這種類型的學習又可稱為知識級學習;而採用演繹策略的學習盡管所學的知識能提高係統的效率,但仍能被原有係統的知識庫所蘊涵,即所學的知識未能改變係統的演繹閉包,因而這種類型的學習又被稱為符號級學習。