友情提示:本站提供全國400多所高等院校招收碩士、博士研究生入學考試歷年考研真題、考博真題、答案,部分學校更新至2012年,2013年;均提供收費下載。 下載流程: 考研真題 點擊“考研試卷””下載; 考博真題 點擊“考博試卷庫” 下載
北京化工大學 2014 攻讀博士學位研究生入學考試 《數據分析與挖掘》考博大綱 一、 適用的專業 管理科學與工程。 二、 考試方法和考試時間 考試為閉卷考試,考試時間為 3 小時。 三、 考試的主要內容 1、 數據挖掘理論基礎 數據挖掘的定義;可以進行數據挖掘的模式類型;數據挖掘的技 術;數據挖掘的面向類型;數據挖掘的主要問題;數據對象與屬性; 數據基本統計描述;數據可視化;度量數據的相似相異性;數據清理; 數據集成;數據集成;數據歸約;數據變化與離散化;數據倉庫的概 念;數據倉庫建模;數據倉庫的設計與使用;數據倉庫的實現;數據 泛化。 2、 數據挖掘模式 數據挖掘頻繁項集、閉項集、關聯規則的基本概念;頻繁項集挖 掘方法;模式評估方法;模式挖掘:一個路線圖;多層、多維空間中 的模式挖掘;基于約束的頻發模式挖掘;挖掘高維數據和巨型模式; 挖掘壓縮或近似模式;模式探索與應用。 3、 分類 分類的基本概念;決策樹歸納;貝葉斯分類方法;基于規則的分 類;模型評估與選擇;提高分類準確度的方法;貝葉斯信念網絡;向 后傳播分類的方法;支持向量機;用頻繁模式分類;惰性學習法或從 近鄰學習;其他分類方法如遺傳算法、粗糙集方法、模糊集方法;有 關分類的相關問題:多類分類、半監督分類、主動學習、遷移學習。 4、 聚類分析 聚類分析的定義;劃分的方法;層次方法;基于密度的方法; 基于網格的方法;聚類評估;基于概率模型的聚類;聚類高維 數據;聚類圖和網絡數據;具有約束的聚類。 5、 離群點檢測 離群點和離群點分析;離群點檢測方法;統計學方法;基于 臨近性的方法;基于聚類的方法;基于分類的方法;挖掘情境離 群點和集體離群點;高維數據中離群點檢測。 6、 數據挖掘的前沿和趨勢 挖掘復雜的數據類型;數據挖掘的其他方法;數據挖掘的應 用;數據挖掘與社會 7、 機器學習的基本理論與知識 線性模型:基本形式,線性回歸,對數幾率回歸,線性判別 分析,多分類學習;決策樹:基本流程,劃分選擇,剪枝處理, 連續與缺失值,多變量決策樹;神經網絡:神經元模型,感知機 與多層網絡,誤差逆傳播算法,全局最小與局部最小;支持向量 機:間隔與支持向量,對偶問題,核函數,軟間隔與正則化,支 持向量機回歸,核方法;貝葉斯分類器:貝葉斯決策論,極大似 然估計,樸素貝葉斯分類器,EM 算法;半監督學習:未標記樣 本,生成式方法,半監督 SVM,圖半監督方法,基于分歧的方法, 半監督聚類。 四、 試卷結構 試卷滿分 100 分,基礎知識題目(簡答題)占 20%,解答題占 60%,綜合性論述題占 20%。 五、 主要參考書 韓家煒 編著,數據挖掘概念與技術,北京:機械工業出版社,2012。 周志華 著,機器學習,北京:清華大學出版社,2016
免責聲明:本文系轉載自網絡,如有侵犯,請聯系我們立即刪除,另:本文僅代表作者個人觀點,與本網站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
|