Learning automaton

學習自動機(learning automaton)是一種1970年代就開始研究的机器学习演算法。學習自動機是由對以往對環境的經驗來選擇目前的動作。若環境是随机性的,且使用了馬可夫決策過程,則這種學習自動機屬於强化学习的演算法。

Learning automaton

學習自動機(learning automaton)是一種1970年代就開始研究的机器学习演算法。學習自動機是由對以往對環境的經驗來選擇目前的動作。若環境是随机性的,且使用了馬可夫決策過程,則這種學習自動機屬於强化学习的演算法。