友情提示:本站提供全國400多所高等院校招收碩士、博士研究生入學考試歷年考研真題、考博真題、答案,部分學校更新至2012年,2013年;均提供收費下載。 下載流程: 考研真題 點擊“考研試卷””下載; 考博真題 點擊“考博試卷庫” 下載
1 目錄 I 考查目標 .......................................................................................2 II 考試形式和試卷結構..................................................................2 III 考查內容 ....................................................................................2 IV. 題型示例及參考答案................................................................3 2 全國碩士研究生入學統一考試應用統計碩士專業學位統計學考試大綱 (考試指導性意見) I 考查目標 全國碩士研究生入學統一考試應用統計碩士專業學位《統計學》考試是為高等院校和科 研院所招收應用統計碩士生兒設置的具有選拔性質的考試科目。其目的是科學、公平、有效 地測試考生是否具備攻讀應用統計專業碩士所必須的基本素質、一般能力和培養潛能,以利 用選拔具有發展潛力的優秀人才入學,為國家的經濟建設培養具有良好職業道德、法制觀念 和國際視野、具有較強分析與解決實際問題能力的高層次、應用型、復合型的統計專業人才。 考試要求是測試考生掌握數據處收集、處理和分析的一些基本統計方法。 具體來說。要求考生: 1. 掌握數據收集和處理的基本分方法。 2. 掌握數據分析的金發原理和方法。 3. 掌握了基本的概率論知識。 4. 具有運用統計方法分析數據和解釋數據的基本能力。 II 考試形式和試卷結構 一、試卷滿分及考試時間 試卷滿分為 150 分,考試時間 180 分鐘。 二、答題方式 答題方式為閉卷、筆試。允許使用計算器(僅僅具備四則運算和開方運算功能的計算器), 但不得使用帶有公式和文本存儲功能的計算器。 三、試卷內容與題型結構 統計學 120 分,有以下三種題型: 單項選擇題 25 題,每小題 2 分,共 50 分 簡答題 3 題,每小題 10 分,共 30 分 計算與分析題 2 題,每小題 20 分,共 40 分 概率論 30 分,有以下三種題型: 單項選擇題 5 題,每小題 2 分,共 10 分 簡答題 1 題,每小題 10 分,共 10 分 計算與分析題 1 題,每小題 10 分,共 10 分 III 考查內容 一、 統計學 1. 調查的組織和實施。 2. 概率抽樣與非概率抽樣。 3. 數據的預處理。 4. 用圖表展示定性數據。 5. 用圖表展示定量數據。 3 6. 用統計量描述數據的水平:平均數、中位數、分位數和眾數。 7. 用統計量描述數據的差異:極差、標準差、樣本方差。 8. 參數估計的基本原理。 9. 一個總體和兩個總體參數的區間估計。 10. 樣本量的確定。 11. 假設檢驗的基本原理。 12. 一個總體和兩個總體參數的檢驗。 13. 方差分析的基本原理。 14. 單因子和雙因子方差分析的實現和結果解釋。 15. 變量間的關系;相關關系和函數關系的差別。 16. 一元線性回歸的估計和檢驗。 17. 用殘差檢驗模型的假定。 18. 多元線性回歸模型。 19. 多元線性回歸的擬合優度和顯著性檢驗; 20. 多重共線性現象。 21. 時間序列的組成要素。 22. 時間序列的預測方法。 二、 概率論 1. 事件及關系和運算; 2. 事件的概率; 3. 條件概率和全概公式; 4. 隨機變量的定義; 5. 離散型隨機變量的分布列和分布函數;離散型均勻分布、二項分布和泊松分布; 6. 連續型隨機變量的概率密度函數和分布函數;均勻分布、正態分布和指數分布; 7. 隨機變量的期望與方差; 8. 隨機變量函數的期望與方差。 IV. 題型示例及參考答案 全國碩士研究生入學統一考試 應用統計碩士專業學位 統計學試題 一. 單項選擇題(本題包括 1—30 題共 30 個小題,每小題 2 分,共 60 分。在每小題給出 的四個選項中,只有一個符合題目要求,把所選項前的字母填在答題卡相應的序號內)。 選擇題答題卡: 題號 1 2 3 4 5 6 7 8 9 10 答案 題號 11 12 13 14 15 16 17 18 19 20 4 答案 題號 21 22 23 24 25 26 27 28 29 30 答案 1. 為了調查某校學生的購書費用支出,從男生中抽取 60 名學生調查,從女生中抽取 40 名學生調查,這種抽樣方法屬于( )。 A. 簡單隨機抽樣 B. 整群抽樣 C. 系統抽樣 D. 分層抽樣 2. 某班學生的平均成績是 80 分,標準差是 10 分。如果已知該班學生的考試分數為對稱 分布,可以判斷考試分數在 70 到 90 分之間的學生大約占( )。 A. 95% B. 89% C. 68% D. 99% 3. 已知總體的均值為 50,標準差為 8,從該總體中隨機抽取樣本量為 64 的樣本,則樣本 均值的數學期望和抽樣分布的標準誤差分別為( )。 A. 50,8 B. 50,1 C. 50,4 D. 8,8 4. 根據一個具體的樣本求出的總體均值 95%的置信區間( )。 A. 以 95%的概率包含總體均值 B. 有 5%的可能性包含總體均值 C. 絕對包含總體均值 D. 絕對包含總體均值或絕對不包含總體均值 5. 一項研究發現,2000 年新購買小汽車的人中有 40%是女性,在 2005 年所作的一項調 查中,隨機抽取 120 個新車主中有 57 人為女性,在 05.0?? 的顯著性水平下,檢驗 2005 年新車主中女性的比例是否有顯著增加,建立的原假設和備擇假設為( )。 A. %40:,%40: 10 ?? ?? HH B. %40:,%40: 10 ?? ?? HH C. %40:,%40: 10 ?? ?? HH D. %40:,%40: 10 ?? ?? HH 6. 在回歸分析中,因變量的預測區間估計是指( )。 A. 對于自變量 x 的一個給定值 0x ,求出因變量 y 的平均值的區間 B. 對于自變量 x 的一個給定值 0x ,求出因變量 y 的個別值的區間 5 C. 對于因變量 y 的一個給定值 0y ,求出自變量 x 的平均值的區間 D. 對于因變量 y 的一個給定值 0y ,求出自變量 x 的平均值的區間 7. 在多元線性回歸分析中,如果 F 檢驗表明線性關系顯著,則意味著( )。 A. 在多個自變量中至少有一個自變量與因變量之間的線性相關系著 B. 所有的自變量與因變量之間的線性關系都顯著 C. 在多個自變量中至少有一個自變量與因變量之間的線性關系不顯著 D. 所有的自變量與因變量之間的線性關系都不顯著 8. 如果時間序列的逐期觀察值按一定的增長率增長或衰減,則適合的預測模型是( )。 A. 移動平均模型 B. 指數平滑模型 C. 線性模型 D. 指數模型 9. 雷達圖的主要用途是( )。 A. 反映一個樣本或總體的結構 B. 比較多個總體的構成 C. 反映一組數據的分布 D. 比較多個樣本的相似性 10. 如果一組數據是對稱分布的,則在平均數加減 2 個標準差之內的數據大約有( )。 A. 68% B. 90% C. 95% D. 99% 11. 從均值為 200、標準差為 50 的總體中,抽出 100?n 的簡單隨機樣本,用樣本均值 x 估 計總體均值 ? ,則 x 的期望值和標準差分別為( )。 A. 200,5 B. 200,20 C. 200,0.5 D. 200,25 12. 95%的置信水平是指( )。 A.總體參數落在一個特定的樣本所構造的區間內的概率為 95% B.總體參數落在一個特定的樣本所構造的區間內的概率為 5% C.在用同樣方法構造的總體參數的多個區間中,包含總體參數的區間比例為 95% D.在用同樣方法構造的總體參數的多個區間中,包含總體參數的區間比例為 5% 13. 在假設檢驗中,如果所計算出的 P 值越小,說明檢驗的結果( )。 A.越顯著 B.越不顯著 C.越真實 D.越不真實 14. 在下面的假定中,哪一個不屬于方差分析中的假定( )。 A.每個總體都服從正態分布 6 B. 各總體的方差相等 C. 觀測值是獨立的 D. 各總體的方差等于 0 15. 在方差分析中,數據的誤差是用平方和來表示的,其中組間平方和反映的是( )。 A. 一個樣本觀測值之間誤差的大小 B. 全部觀測值誤差的大小 C. 各個樣本均值之間誤差的大小 D. 各個樣本方差之間誤差的大小 16. 在多元線性回歸分析中,t 檢驗是用來檢驗( )。 A. 總體線性關系的顯著性 B. 各回歸系數的顯著性 C. 樣本線性關系的顯著性 D. 0: 210 ???? kH ??? ? 17. 為研究食品的包裝和銷售地區對其銷售量是否有影響,在三個不同地區中用三種不同包 裝方法進行銷售,根據獲得的銷售量數據計算得到下面的方差分析表。表中“A”單元格 和“B”單元格內的結果是( )。 差異源 SS df MS F 行 22.22 2 11.11 A 列 955.56 2 477.78 B 誤差 611.11 4 152.78 總計 1588.89 8 A. 0.073 和 3.127 B. 0.023 和 43.005 C. 13.752 和 0.320 D. 43.005 和 0.320 18. 對某時間序列建立的預測方程為 t tY )8.0(100? ?? ,這表明該時間序列各期的觀察值 ( )。 A. 每期增加 0.8 B. 每期減少 0.2 C. 每期增長 80% D. 每期減少 20% 19. 進行多元線性回歸時,如果回歸模型中存在多重共線性,則( )。 A. 整個回歸模型的線性關系不顯著 B. 肯定有一個回歸系數通不過顯著性檢驗 C. 肯定導致某個回歸系數的符號與預期的相反 D. 可能導致某些回歸系數通不過顯著性檢驗 20. 如果時間序列不存在季節變動,則各期的季節指數應( )。 A. 等于 0 B. 等于 1 C. 小于 0 D. 小于 1 21. 一所中學的教務管理人員認為,中學生中吸煙的比例超過 30%,為檢驗這一說法是否 屬實,該教務管理人員抽取一個隨機樣本進行檢驗,建立的原假設和備擇假設為 %30:,%30: 10 ?? ?? HH 。檢驗結果是沒有拒絕原假設,這表明( )。 A.有充分證據證明中學生中吸煙的比例小于 30% B.中學生中吸煙的比例小于等于 30% C.沒有充分證據表明中學生中吸煙的超過 30% 7 D.有充分證據證明中學生中吸煙的比例超過 30% 22. 某藥品生產企業采用一種新的配方生產某種藥品,并聲稱新配方藥的療效遠好于舊的配 方。為檢驗企業的說法是否屬實,醫藥管理部門抽取一個樣本進行檢驗。該檢驗的原假 設所表達的是( )。 A.新配方藥的療效有顯著提高 B.新配方藥的療效有顯著降低 C.新配方藥的療效與舊藥相比沒有變化 D.新配方藥的療效不如舊藥 23. 在回歸分析中,殘差平方和 SSE 反映了 y 的總變差中( )。 A. 由于 x 與 y 之間的線性關系引起的 y 的變化部分 B. 由于 x 與 y 之間的非線性關系引起的 y 的變化部分 C. 除了 x 對 y 的線性影響之外的其他因素對 y 變差的影響 D. 由于 y 的變化引起的 x 的誤差 24. 在公務員的一次考試中,抽取 49 個應試者,得到的平均考試成績為 81 分,標準差 12?s 分。該項考試中所有應試者的平均考試成績 95%的置信區間為( )。 A.81±1.96 B.81±3.36 C.81±0.48 D.81±4.52 25. 某大學共有 5000 名本科學生,每月平均生活費支出是 500 元,標準差是 100 元。假 定該校學生的生活費支出為對稱分布,月生活費支出在 400 元至 600 元之間的學生人 數大約為( )。 A. 4750 人 B. 4950 人 C. 4550 人 D. 3400 人 26. 將一顆質地均勻的骰子(它是一種各面上分別標有點數 1,2,3,4,5,6 的正方體玩 具)先后拋擲 3 次,至少出現一次 6 點向上的概率是() A. 5 216 B. 25 216 C. 31 216 D. 91 216 27. 離散型隨機變量? 的分布列為 0 1 2 0.2 a b ? ? ? ? ? ? ,其中 ,a b 是未知數,如果已知? 取 1 的 概率和取 2 的概率相等,則 a ?( )。 A.0.2 B.0.3 C.0.4 D.0.5 28. 甲乙兩人將進行一局象棋比賽,考慮事件 ? ?A ? 甲勝乙負 ,則 A 為( )。 A.甲負乙勝 B.甲乙平局 C.甲負 D.甲負或平局 29. 對于隨機變量? ,有 ? ?10 10D ? ? ,則 ? ?D ? ? ( )。其中 ? ?D ? 表示隨機變量? 的 方差。 A.0.1 B.1 C.10 D.100 30. 設函數 ( )f x 在區間[ , ]a b 上等于 0.5,在此區間之外等于 0,如果 ( )f x 可以作為某連 續型隨機變量的密度函數,則區間[ , ]a b 可以是( )。 A.[0,0.5] B.[0.5,2.5] C.[1,1.5] D.[2,3] 二. 簡要回答下列問題(本題包括 1—4 題共 4 個小題,每小題 10 分,共 40 分)。 8 1. 簡述假設檢驗中 P 值的含義。 2. 已知甲乙兩個地區的人均收入水平都是 5000 元。這個 5000 元對兩個地區收入水平 的代表性是否一樣?請說明理由。 3. 簡述分解法預測的基本步驟。 4. 正態分布的概率密度函數 ( )f x 有兩個參數 ? 和? ,請結合函數 ( )f x 的幾何形狀 說明 ? 和? 的意義。 三. 計算與分析題(本題包括 1—3 題共 3 個小題,第 1 小題和第 2 小題每題 20 分,第 3 小 題 10 分,共 50 分)。 1. 某企業生產的袋裝食品采用自動打包機包裝,每袋標準重量為 100 克。現從某天 生產的一批產品中按重復抽樣隨機抽取 50 包進行檢查,測得每包重量(克)如下: 每包重量(克) 包數 96-98 2 98-100 3 100-102 34 102-104 7 104-106 4 合計 50 (1) 確定該種食品平均重量 95%的置信區間。 (2) 采用假設檢驗方法檢驗該批食品的重量是否符合標準要求?( 05.0?? ,寫 出檢驗的具體步驟)。 2. 一家產品銷售公司在 30 個地區設有銷售分公司。為研究產品銷售量(y)與該公司的 銷售價格(x1)、各地區的年人均收入(x2)、廣告費用(x3)之間的關系,搜集到 30 個地區的有關數據。利用 Excel 得到下面的回歸結果( 05.0?? ): 方差分析表 變差來源 df SS MS F Significance F 回歸 4008924.7 8.88341E-13 殘差 — — 總計 29 13458586.7 — — — 參數估計表 Coefficients 標準誤差 t Stat P-value Intercept 7589.1025 2445.0213 3.1039 0.00457 X Variable 1 -117.8861 31.8974 -3.6958 0.00103 X Variable 2 80.6107 14.7676 5.4586 0.00001 X Variable 3 0.5012 0.1259 3.9814 0.00049 (1) 將方差分析表中的所缺數值補齊。 (2) 寫出銷售量與銷售價格、年人均收入、廣告費用的多元線性回歸方程,并解釋各 回歸系數的意義。 (3) 檢驗回歸方程的線性關系是否顯著? (4) 計算判定系數 2 R ,并解釋它的實際意義。 9 (5) 計算估計標準誤差 es ,并解釋它的實際意義。 3. 用 , ,A B C 三類不同元件連接成兩個系統 1N 和 2N 。當元件 , ,A B C 都正常工作時, 系統 1N 正常工作;當元件 A 正常工作且元件 ,B C 中至少有一個正常工作時,系統 2N 正常工作。已知元件 , ,A B C 正常工作的概率依次為 0.80,0.90,0.90,且某個元 件是否正常工作與其他元件無關。分別求系統 1N 和 2N 正常工作的概率 1P 和 2P 。 參考答案 一、單項選擇題 1. D;2. C;3. B;4. D;5. C;6. B;7. A;8. D;9. D;10. C; 11. A;12. C;13. A;14. D;15. C;16. B;17. A;18.D;19.D;20.B; 21.C;22.C;23.C;24.B;25.D;26.D;27.C;28.D;29.A;30.B。 二、簡要回答題 1. (1)如果原假設 0H 是正確的,所得到的樣本結果會像實際觀測結果那么極端或 更極端的概率,稱為 P 值。 (2) P 值是指在總體數據中,得到該樣本數據的概率。 (3)P 值是假設檢驗中的另一個決策工具,對于給定的顯著性水平? ,若 ??P , 則拒絕原假設。 2. 這要看情況而定。如果兩個地區收入的標準差接近相同時,可以認為 5000 元對兩 個地區收入水平的代表性接近相同。如果標準差有明顯不同,則標準差小的,5000 元對該地區收入水平的代表性就要好于標準差大的。 3. (1)確定并分離季節成分。計算季節指數,以確定時間序列中的季節成分。然后 將季節成分從時間序列中分離出去,即用每一個時間序列觀測值除以相應的季節指 數,以消除季節成分。 (2)建立預測模型并進行預測。對消除季節成分的時間序列建立適當的預測模型,并 根據這一模型進行預測。 (3)計算出最后的預測值。用預測值乘以相應的季節指數,得到最終的預測值。 4. 正態分布的概率密度函數是一個左右對稱的鐘形曲線,參數 ? 是這個曲線的對稱 軸,同時也決定了曲線的位置, ? 也是正態分布的數學期望;而參數? 的大小決 定了曲線的陡峭程度,? 越小,則曲線的形狀越陡峭,越集中在對稱軸 x ?? 的附 10 近,這和 2 ? 是正態分布的方差的直觀意義一致。 三、計算與分析題 1. (1)已知: 50?n , 96.1205.0 ?z 。 樣本均值為: 32.101 50 50661 ??? ?? n fM x k i ii 克, 樣本標準差為: 634.1 49 88.130 1 )( 1 2 ?? ? ? ? ?? n fxM s k i ii 克。 由于是大樣本,所以食品平均重量 95%的置信區間為: 453.032.101 50 634.1 96.132.1012 ?????? n s zx ? 即(100.867,101.773)。 (2)提出假設: 100:0 ??H , 100:1 ??H 計算檢驗的統計量: 712.5 50634.1 10032.1010 ? ? ? ? ? ns x z ? 由于 96.1712.5 205.0 ??? zz ,所以拒絕原假設,該批食品的重量不符合標準要 求。 2.(1) 方差分析表 變差來源 df SS MS F Significance F 回歸 3 12026774.1 4008924.7 72.80 8.88341E-13 殘差 26 1431812.6 55069.7 — — 總計 29 13458586.7 — — — (2)多元線性回歸方程為: 321 5012.06107.808861.1171025.7589? xxxy ???? 。 8861.117? 1 ??? 表示:在年人均收入和廣告費用不變的情況下,銷售價格每增加一 個單位,銷售量平均下降 117.8861 個單位; 6107.80? 2 ?? 表示:在銷售價格和廣告費 用不變的情況下,年人均收入每增加一個單位,銷售量平均增加 80.6107 個單位; 11 5012.0? 3 ?? 表示:在年銷售價格和人均收入不變的情況下,廣告費用每增加一個單位, 銷售量平均增加 0.5012 個單位。 (3)由于 Significance F=8.88341E-13< 05.0?? ,表明回歸方程的線性關系顯著。 (4) %36.89 7.13458586 1.120267742 ??? SST SSR R ,表明在銷售量的總變差中,被估計的 多元線性回歸方程所解釋的比例為 89.36%,說明回歸方程的擬合程度較高。 (5) 67.2347.55069 1 ??? ?? ? MSE kn SSE se 。表明用銷售價格、年人 均收入和廣告費用來預測銷售量時,平均的預測誤差為 234.67。 3. 解:分別記元件 , ,A B C 正常工作為事件 , ,A B C ,由已知條件可得 ( ) 0.8, ( ) 0.9, ( ) 0.9P A P B P C? ? ? 記系統 1N 正常工作為事件 1N ,則有 1 1( ) ( )P P N P ABC? ? ; 由于事件 , ,A B C 相互獨立,所以 1 ( ) ( ) ( ) 0.8 0.9 0.9 0.648P P A P B P C? ? ? ? ? 記系統 2N 正常工作為事件 2N ,則有 ? ?? ?2 2( )P P N P A B C? ? ? ? ; 由于 , ,A B C 相互獨立,則有 ? ?? ? ? ? 2 ( ) [1 ( ) ( )] ( ) 1 1 ( ) 1 ( ) 0.8 1 0.1 0.1 0.792 P P A P B P C P A P B P C? ? ? ? ? ? ? ?? ?? ? ? ? ? ? ?
免責聲明:本文系轉載自網絡,如有侵犯,請聯系我們立即刪除,另:本文僅代表作者個人觀點,與本網站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
|