(網路圖片)
一位計算機科學家已經發表了一篇論文 ,詳細描述了計算機系統在觀看了兩分鐘長的,人類桌游比賽的視頻之後,如何成功贏得比賽。
在處理了人類進行四子棋、五子棋、國際像棋等比賽視頻剪輯的過程中,其中包括比賽勝利、平局和那些結果未知的比賽視頻,計算機系統會藉助視覺辨認系統識別棋盤、棋子和導致每一種結果的不同走法。隨後一個獨特的公式會讓系統來檢測所有可行的移動,並且藉助從所有可能的結果所收集到的數據來計算最合適的移動。
巴黎第七大學的盧卡斯-凱撒在留意到我們知識領域中的一個巨大空白之後開發了一種學習演算法,他發現物體認知機器學習試驗相當的流行,儘管未來在自主機器人的創造上有著足夠多的用法,然而研究高級複雜的計算機學習的並不多見。凱撒決定使用遊戲作為一種初級的學習工具,因為它們是許多真實世界中相互作用場景的一種自然模型,在更廣闊的環境當中會使結果變得更有意義。
凱撒使用一臺內吁只有4GB的筆記本電腦和一個單一的處理器核心作為他首次的測試項目,他解決了阻礙之前計算機學習試驗的主要問題,將知識假設為歸納邏輯程序設計(ILP)。用於遊戲學習的歸納邏輯程序設計的一個典型案例就是Progol,這個程序需要視覺線索和背景知識來學習簡單的遊戲。對於策略類遊戲比如說四子棋和五子棋,凱撒推斷需要更細膩的邏輯系統。
他放棄了最初的單一公式並且使用能夠識別桌面遊戲的行、列和對角線的相關結構,而且使用了7種不同的邏輯系統,從每個邏輯系統收集到的數據能夠設計出一種調整後的公式。一個新增加的普通遊戲比賽程序幫助計算機系統學習如何使用策略、學習合法的移動以及如何獲得最後的勝利。
論文中寫到:「這種組合讓它在我們進行的試驗中形成很短而且直觀的公式,而且有確鑿的理論證據表明它會出現另外的問題。」凱撒計畫改編系統來解決這些問題,比如需要分級、結構學習或者一種概率公式的形式,所有的這些問題都將遲早出現在自主智能機器人的研發過程中。