11

我一直在學習了很多關於使用機器學習曲線通過觀看克里斯托弗主教視頻(http://videolectures.net/mlss04_bishop_gmvm/)。我覺得它非常有趣,並且觀察了其他幾個類別(機器學習/圖表),但是想知道是否有人有更多學習方法的建議?關於在機器學習中使用圖論的建議?

我的問題是,雖然影片給予了極大的高層次的理解,我沒有在它更實用的技能呢。我讀過關於機器學習/模式的主教書以及Norvig的AI書,但兩者似乎都沒有涉及具體使用圖。隨着搜索引擎和社交網絡的出現,我認爲機器學習在圖表上會很受歡迎。

如果可能的話,任何人都可以建議的資源學習的榜樣? (我是新來的這個領域和發展是我的一個愛好,所以我提前抱歉,如果有學習from..I嘗試谷歌和大學網站超級明顯的資源)。

在此先感謝!

回答

9

麥克阿瑟天才獎收件人和斯坦福大學達夫尼·科勒教授合作撰寫了一份明確的教科書貝葉斯網絡題爲Probabalistic Graphical Models,其中包含了嚴格的介紹適用於AI圖論。它可能不完全符合你的要求,但在它的領域,它是非常重視。

+0

只是添加到您的偉大的書籍推薦。作者(斯坦福大學教授)今年開始有一堂免費課程:http://www.pgm-class.org/ – Lostsoul

3

您可以在斯坦福大學參加免費在線課程機器學習和人工智能:

https://www.ai-class.com/
http://www.ml-class.org/

類不是簡單地集中在圖論,但包括該領域的更廣泛的介紹和他們會給你一個關於如何以及何時應用哪種算法的好主意。我知道你已經閱讀過關於AI和ML的入門書籍,但我認爲在線課程會爲你提供很多你可以嘗試的練習。

15

首先,我會強烈建議書Social Network Analysis for Startups由馬克西姆Tsvetovat和亞歷山大KOUZNETSOV。像這樣一本書是誰需要快速獲得在特定學科基本流暢度(在這種情況下,圖論),這樣他們就可以開始編寫代碼來解決在這一領域問題的程序員一大福音。兩位作者都是受過學術訓練的圖論者,但他們的書的目標讀者是程序員。本書中提供的大量示例幾乎都是使用networkx庫的python。

其次,爲您心目中的項目,種庫是如果非常有幫助的不是不可缺少的:

  • 圖分析:例如,優秀networkx(蟒蛇)或igraph (蟒,R,等人。)是我可以推薦的兩個;和

  • 圖形渲染:優秀graphViz,可用於 獨立的命令行,但更可能你會想 使用它作爲一個庫;有在所有主要 語言的Graphviz綁定(例如,爲Python有至少三個我知道的,雖然 是pygraphviz我的偏好;對於R有rgraphviz它是bioconductor包套件的 一部分)。 Rgraphviz具有優秀的文檔(特別參見該軟件包附帶的Vignette)。

它是安裝並開始使用這些庫,特別是嘗試使用它們

  • 學分析 的基本圖論詞彙和單位很容易(如度序列分佈,節點遍歷,圖 運營商);

  • 區分圖中的關鍵節點(例如,度中心性, 特徵向量中心性,協調性);和

  • 以識別原型圖子結構(例如,二分結構,三角形,週期,派系,集羣,社區和核心)。

使用圖形分析庫快速理解圖形理論的這些基本要素的值是在大多數情況下有一個1:剛纔提到和概念之間1映射 (networkx或igraph)庫中的函數。因此,例如,您可以快速生成兩個尺寸相同(節點編號)的隨機圖,渲染然後查看它們,然後輕鬆地計算出例如平均程度序列或者介於兩者和觀察者之間的中心性第一手如何改變這些參數的值會影響圖的結構。

W/r/t ML和圖的組合理論技術,這裏是我個人的有限經驗。我在日常工作中使用ML,並且少用圖論,但很少在一起使用。這只是一個限於我個人經驗的經驗觀察,所以我沒有發現在這兩個領域中結合技術似乎很自然的問題。大多數圖論理論分析在ML的盲點中是有用的,這是大量標記訓練數據的可用性。 - 監督ML技術在很大程度上取決於這一點。

用於說明這一點的一類問題是在線欺詐檢測/預測。收集數據(例如,歸因於特定用戶的在線交易集)幾乎是不可能的,您可以合理確定地將其分離並標記爲「欺詐性賬戶」。如果他們特別聰明和有效,那麼你會錯誤標籤爲「合法」,並且對於那些涉嫌欺詐的賬戶,通常是第一級診斷(例如,,額外的身份驗證或增加的等待期以換取現金)往往足以導致他們停止進一步的活動(這將允許進行明確的分類)。最後,即使你以某種方式設法收集合理無噪聲的數據集來訓練你的ML算法,它肯定會嚴重失衡(即比「欺詐」數據點更「合法」);這個問題可以通過統計預處理(重新採樣)和算法調整(加權)來管理,但它仍然是一個問題,可能會降低結果的質量。

所以,雖然我從來沒有能夠成功地將ML技術用於這些類型的問題,但至少在兩個實例中,我已經使用了圖論,取得了一些成功 - 在最近的例子中,通過應用從卡內基梅隆一個小組的項目最初指向detection of online auction fraud on ebay

1

雖然這並不完全符合您的要求,但textgraphs是一個專注於圖論與自然語言處理之間關係的研討會。 Here是一個鏈接。我相信這個研討會還產生了this這本書。