友情提示:本站提供全國400多所高等院校招收碩士、博士研究生入學考試歷年考研真題、考博真題、答案,部分學校更新至2012年,2013年;均提供收費下載。 下載流程: 考研真題 點擊“考研試卷””下載; 考博真題 點擊“考博試卷庫” 下載
1 432-統計學 一、考查目標 全國碩士研究生入學統一考試應用統計碩士專業學位《統計學》考試是為高等院校和科 研院所招收應用統計碩士生兒設置的具有選拔性質的考試科目。其目的是科學、公平、有效 地測試考生是否具備攻讀應用統計專業碩士所必須的基本素質、一般能力和培養潛能,以利 用選拔具有發展潛力的優秀人才入學,為國家的經濟建設培養具有良好職業道德、法制觀念 和國際視野、具有較強分析與解決實際問題能力的高層次、應用型、復合型的統計專業人才。 考試要求是測試考生掌握數據處收集、處理和分析的一些基本統計方法。 具體來說。要求考生: 1.掌握數據收集和處理的基本分方法。 2.掌握數據分析的金發原理和方法。 3.掌握了基本的概率論知識。 4.具有運用統計方法分析數據和解釋數據的基本能力。 二、考試形式和試卷結構 1.試卷滿分及考試時間 試卷滿分為 150 分,考試時間 180 分鐘。 2.答題方式 答題方式為閉卷、筆試。允許使用計算器(僅僅具備四則運算和開方運算功能的計算器), 但不得使用帶有公式和文本存儲功能的計算器。 3.試卷內容與題型結構 統計學 120 分,有以下三種題型: 單項選擇題 25 題,每小題 2 分,共 50 分 簡答題 3 題,每小題 10 分,共 30 分 計算與分析題 2 題,每小題 20 分,共 40 分 概率論 30 分,有以下三種題型: 單項選擇題 5 題,每小題 2 分,共 10 分 簡答題 1 題,每小題 10 分,共 10 分 計算與分析題 1 題,每小題 10 分,共 10 分 三、考查內容 1.統計學 調查的組織和實施。 2 概率抽樣與非概率抽樣。 數據的預處理。 用圖表展示定性數據。 用圖表展示定量數據。 用統計量描述數據的水平:平均數、中位數、分位數和眾數。 用統計量描述數據的差異:極差、標準差、樣本方差。 參數估計的基本原理。 一個總體和兩個總體參數的區間估計。 樣本量的確定。 假設檢驗的基本原理。 一個總體和兩個總體參數的檢驗。 方差分析的基本原理。 單因子和雙因子方差分析的實現和結果解釋。 變量間的關系;相關關系和函數關系的差別。 一元線性回歸的估計和檢驗。 用殘差檢驗模型的假定。 多元線性回歸模型。 多元線性回歸的擬合優度和顯著性檢驗; 多重共線性現象。 時間序列的組成要素。 時間序列的預測方法。 2.概率論 事件及關系和運算; 事件的概率; 條件概率和全概公式; 隨機變量的定義; 離散型隨機變量的分布列和分布函數;離散型均勻分布、二項分布和泊松分布; 連續型隨機變量的概率密度函數和分布函數;均勻分布、正態分布和指數分布; 隨機變量的期望與方差; 隨機變量函數的期望與方差。 四、題型示例及參考答案 全國碩士研究生入學統一考試 應用統計碩士專業學位統計學試題 3 一、單項選擇題(本題包括 1—30 題共 30 個小題,每小題 2 分,共 60 分。在每小題給 出的四個選項中,只有一個符合題目要求,把所選項前的字母填在答題卡相應的序號內)。 選擇題答題卡: 題號 1 2 3 4 5 6 7 8 9 10 答案 題號 11 12 13 14 15 16 17 18 19 20 答案 題號 21 22 23 24 25 26 27 28 29 30 答案 1.為了調查某校學生的購書費用支出,從男生中抽取 60 名學生調查,從女生中抽取 40 名學生調查,這種抽樣方法屬于( )。 A.簡單隨機抽樣 B.整群抽樣 C.系統抽樣 D.分層抽樣 2.某班學生的平均成績是 80 分,標準差是 10 分。如果已知該班學生的考試分數為對稱 分布,可以判斷考試分數在 70 到 90 分之間的學生大約占( )。 A.95% B.89% C.68% D.99% 3.已知總體的均值為 50,標準差為 8,從該總體中隨機抽取樣本量為 64 的樣本,則樣本 均值的數學期望和抽樣分布的標準誤差分別為( )。 A.50,8 B.50,1 C.50,4 D.8,8 4.根據一個具體的樣本求出的總體均值 95%的置信區間( )。 A.以 95%的概率包含總體均值 B.有 5%的可能性包含總體均值 C.絕對包含總體均值 D.絕對包含總體均值或絕對不包含總體均值 5.一項研究發現,2000 年新購買小汽車的人中有 40%是女性,在 2005 年所作的一項調 查中,隨機抽取 120 個新車主中有 57 人為女性,在 05.0?? 的顯著性水平下,檢驗 2005 年新車主中女性的比例是否有顯著增加,建立的原假設和備擇假設為( )。 A. %40:,%40: 10 ?? ?? HH B. %40:,%40: 10 ?? ?? HH C. %40:,%40: 10 ?? ?? HH D. %40:,%40: 10 ?? ?? HH 6.在回歸分析中,因變量的預測區間估計是指( )。 4 A.對于自變量 x 的一個給定值 0 x ,求出因變量 y 的平均值的區間 B.對于自變量 x 的一個給定值 0 x ,求出因變量 y 的個別值的區間 C.對于因變量 y 的一個給定值 0 y ,求出自變量 x 的平均值的區間 D.對于因變量 y 的一個給定值 0 y ,求出自變量 x 的平均值的區間 7.在多元線性回歸分析中,如果 F 檢驗表明線性關系顯著,則意味著( )。 A.在多個自變量中至少有一個自變量與因變量之間的線性相關系著 B.所有的自變量與因變量之間的線性關系都顯著 C.在多個自變量中至少有一個自變量與因變量之間的線性關系不顯著 D.所有的自變量與因變量之間的線性關系都不顯著 8.如果時間序列的逐期觀察值按一定的增長率增長或衰減,則適合的預測模型是( )。 A.移動平均模型 B.指數平滑模型 C.線性模型 D.指數模型 9.雷達圖的主要用途是( )。 A.反映一個樣本或總體的結構 B.比較多個總體的構成 C.反映一組數據的分布 D.比較多個樣本的相似性 10.如果一組數據是對稱分布的,則在平均數加減 2 個標準差之內的數據大約有( )。 A.68% B.90% C.95% D.99% 11.從均值為 200、標準差為 50 的總體中,抽出 100?n 的簡單隨機樣本,用樣本均值 x 估計總體均值 ? ,則 x 的期望值和標準差分別為( )。 A.200,5 B.200,20 C.200,0.5 D.200,25 12.95%的置信水平是指( )。 A.總體參數落在一個特定的樣本所構造的區間內的概率為 95% B.總體參數落在一個特定的樣本所構造的區間內的概率為 5% C.在用同樣方法構造的總體參數的多個區間中,包含總體參數的區間比例為 95% D.在用同樣方法構造的總體參數的多個區間中,包含總體參數的區間比例為 5% 13.在假設檢驗中,如果所計算出的 P 值越小,說明檢驗的結果( )。 A.越顯著 B.越不顯著 C.越真實 D.越不真實 14.在下面的假定中,哪一個不屬于方差分析中的假定( )。 A.每個總體都服從正態分布 B.各總體的方差相等 C.觀測值是獨立的 D.各總體的方差等于 0 5 15.在方差分析中,數據的誤差是用平方和來表示的,其中組間平方和反映的是( )。 A.一個樣本觀測值之間誤差的大小 B.全部觀測值誤差的大小 C.各個樣本均值之間誤差的大小 D.各個樣本方差之間誤差的大小 16.在多元線性回歸分析中,t 檢驗是用來檢驗( )。 A.總體線性關系的顯著性 B.各回歸系數的顯著性 C.樣本線性關系的顯著性 D. 0: 210 ???? k H ??? ? 17.為研究食品的包裝和銷售地區對其銷售量是否有影響,在三個不同地區中用三種不同 包裝方法進行銷售,根據獲得的銷售量數據計算得到下面的方差分析表。表中“A”單元格和 “B”單元格內的結果是( )。 差異源 SS df MS F 行 22.22 2 11.11 A 列 955.56 2 477.78 B 誤差 611.11 4 152.78 總計 1588.89 8 A.0.073 和 3.127 B.0.023 和 43.005 C.13.752 和 0.320 D.43.005 和 0.320 18.對某時間序列建立的預測方程為 t t Y )8.0(100? ?? ,這表明該時間序列各期的觀察值 ( )。 A.每期增加 0.8 B.每期減少 0.2 C.每期增長 80% D.每期減少 20% 19.進行多元線性回歸時,如果回歸模型中存在多重共線性,則( )。 A.整個回歸模型的線性關系不顯著 B.肯定有一個回歸系數通不過顯著性檢驗 C.肯定導致某個回歸系數的符號與預期的相反 D.可能導致某些回歸系數通不過顯著性檢驗 20.如果時間序列不存在季節變動,則各期的季節指數應( )。 A.等于 0 B.等于 1 C.小于 0 D.小于 1 21.一所中學的教務管理人員認為,中學生中吸煙的比例超過 30%,為檢驗這一說法是否 屬實,該教務管理人員抽取一個隨機樣本進行檢驗,建立的原假設和備擇假設為 %30:,%30: 10 ?? ?? HH 。檢驗結果是沒有拒絕原假設,這表明( )。 6 A.有充分證據證明中學生中吸煙的比例小于 30% B.中學生中吸煙的比例小于等于 30% C.沒有充分證據表明中學生中吸煙的超過 30% D.有充分證據證明中學生中吸煙的比例超過 30% 22.某藥品生產企業采用一種新的配方生產某種藥品,并聲稱新配方藥的療效遠好于舊的 配方。為檢驗企業的說法是否屬實,醫藥管理部門抽取一個樣本進行檢驗。該檢驗的原假設 所表達的是( )。 A.新配方藥的療效有顯著提高 B.新配方藥的療效有顯著降低 C.新配方藥的療效與舊藥相比沒有變化 D.新配方藥的療效不如舊藥 23.在回歸分析中,殘差平方和 SSE 反映了 y 的總變差中( )。 A.由于 x 與 y 之間的線性關系引起的 y 的變化部分 B.由于 x 與 y 之間的非線性關系引起的 y 的變化部分 C.除了 x 對 y 的線性影響之外的其他因素對 y 變差的影響 D.由于 y 的變化引起的 x 的誤差 24.在公務員的一次考試中,抽取 49 個應試者,得到的平均考試成績為 81 分,標準差 12?s 分。該項考試中所有應試者的平均考試成績 95%的置信區間為( )。 A.81±1.96 B.81±3.36 C.81±0.48 D.81±4.52 25.某大學共有 5000 名本科學生,每月平均生活費支出是 500 元,標準差是 100 元。假 定該校學生的生活費支出為對稱分布,月生活費支出在 400 元至 600 元之間的學生人數大約 為( )。 A.4750 人 B.4950 人 C.4550 人 D.3400 人 26.將一顆質地均勻的骰子(它是一種各面上分別標有點數 1,2,3,4,5,6 的正方體 玩具)先后拋擲 3 次,至少出現一次 6 點向上的概率是( ) A. 5 216 B. 25 216 C. 31 216 D. 91 216 27.離散型隨機變量? 的分布列為 0 1 2 0.2 a b ? ? ? ? ? ? ,其中 ,a b 是未知數,如果已知? 取 1 的概率和取 2 的概率相等,則a ? ( )。 A.0.2 B.0.3 C.0.4 D.0.5 28.甲乙兩人將進行一局象棋比賽,考慮事件 ? ?A ? 甲 勝 乙 負 ,則 A 為( )。 A.甲負乙勝 B.甲乙平局 C.甲負 D.甲負或平局 29.對于隨機變量? ,有 ? ?10 10D ? ? ,則 ? ?D ? ? ( )。其中 ? ?D ? 表示隨機變量? 的方差。 A.0.1 B.1 C.10 D.100 7 30.設函數 ( )f x 在區間[ , ]a b 上等于 0.5,在此區間之外等于 0,如果 ( )f x 可以作為某連 續型隨機變量的密度函數,則區間[ , ]a b 可以是( )。 A.[0, 0.5] B.[0.5, 2.5] C.[1,1.5] D.[2, 3] 二、簡要回答下列問題(本題包括 1—4 題共 4 個小題,每小題 10 分,共 40 分)。 1.簡述假設檢驗中 P 值的含義。 2.已知甲乙兩個地區的人均收入水平都是 5000 元。這個 5000 元對兩個地區收入水平的 代表性是否一樣?請說明理由。 3.簡述分解法預測的基本步驟。 4.正態分布的概率密度函數 ( )f x 有兩個參數 ? 和? ,請結合函數 ( )f x 的幾何形狀說明 ? 和? 的意義。 三、計算與分析題(本題包括 1—3 題共 3 個小題,第 1 小題和第 2 小題每題 20 分,第 3 小 題 10 分,共 50 分)。 1.某企業生產的袋裝食品采用自動打包機包裝,每袋標準重量為 100 克。現從某天生產 的一批產品中按重復抽樣隨機抽取 50 包進行檢查,測得每包重量(克)如下: 每包重量(克) 包數 96-98 2 98-100 3 100-102 34 102-104 7 104-106 4 合計 50 (1)確定該種食品平均重量 95%的置信區間。 (2)采用假設檢驗方法檢驗該批食品的重量是否符合標準要求?( 05.0?? ,寫出檢 驗的具體步驟)。 2.一家產品銷售公司在 30 個地區設有銷售分公司。為研究產品銷售量(y)與該公司的銷 售價格(x1)、各地區的年人均收入(x2)、廣告費用(x3)之間的關系,搜集到 30 個地區的有 關數據。利用 Excel 得到下面的回歸結果( 05.0?? ): 方差分析表 變差來源 df SS MS F Significance F 回歸 4008924.7 8.88341E-13 殘差 — — 總計 29 13458586.7 — — — 8 參數估計表 Coefficients 標準誤差 t Stat P-value Intercept 7589.1025 2445.0213 3.1039 0.00457 X Variable 1 -117.8861 31.8974 -3.6958 0.00103 X Variable 2 80.6107 14.7676 5.4586 0.00001 X Variable 3 0.5012 0.1259 3.9814 0.00049 (1)將方差分析表中的所缺數值補齊。 (2)寫出銷售量與銷售價格、年人均收入、廣告費用的多元線性回歸方程,并解釋各 回歸系數的意義。 (3)檢驗回歸方程的線性關系是否顯著? (4)計算判定系數 2 R ,并解釋它的實際意義。 (5)計算估計標準誤差 e s ,并解釋它的實際意義。 3.用 , ,A B C 三類不同元件連接成兩個系統 1 N 和 2 N 。當元件 , ,A B C 都正常工作時,系 統 1 N 正常工作;當元件 A 正常工作且元件 ,B C 中至少有一個正常工作時,系統 2 N 正常工 作。已知元件 , ,A B C 正常工作的概率依次為 0.80,0.90,0.90,且某個元件是否正常工作與其 他元件無關。分別求系統 1 N 和 2 N 正常工作的概率 1 P 和 2 P 。 參考答案 一、單項選擇題 1. D;2. C;3. B;4. D;5. C;6. B;7. A;8. D;9. D;10. C; 11. A;12. C;13. A;14. D;15. C;16. B;17. A;18.D;19.D;20.B; 21.C;22.C;23.C;24.B;25.D;26.D;27.C;28.D;29.A;30.B。 二、簡要回答題 1.(1)如果原假設 0 H 是正確的,所得到的樣本結果會像實際觀測結果那么極端或更極 端的概率,稱為 P 值。 (2) P 值是指在總體數據中,得到該樣本數據的概率。 (3) P 值是假設檢驗中的另一個決策工具,對于給定的顯著性水平? ,若 ??P ,則 拒絕原假設。 2.這要看情況而定。如果兩個地區收入的標準差接近相同時,可以認為 5000 元對兩個地 區收入水平的代表性接近相同。如果標準差有明顯不同,則標準差小的,5000 元對該地區 收入水平的代表性就要好于標準差大的。 (1)確定并分離季節成分。計算季節指數,以確定時間序列中的季節成分。然后將季 9 節成分從時間序列中分離出去,即用每一個時間序列觀測值除以相應的季節指數,以消除季 節成分。 (2)建立預測模型并進行預測。對消除季節成分的時間序列建立適當的預測模型,并 根據這一模型進行預測。 (3)計算出最后的預測值。用預測值乘以相應的季節指數,得到最終的預測值。 3.正態分布的概率密度函數是一個左右對稱的鐘形曲線,參數 ? 是這個曲線的對稱軸, 同時也決定了曲線的位置, ? 也是正態分布的數學期望;而參數? 的大小決定了曲線的陡 峭程度,? 越小,則曲線的形狀越陡峭,越集中在對稱軸 x ?? 的附近,這和 2 ? 是正態分 布的方差的直觀意義一致。 三、計算與分析題 1.(1)已知: 50?n , 96.1205.0 ?z 。 樣本均值為: 32.101 50 50661 ??? ? ? n fM x k i ii 克, 樣本標準差為: 634.1 49 88.130 1 )( 1 2 ?? ? ? ? ? ? n fxM s k i ii 克。 由于是大樣本,所以食品平均重量 95%的置信區間為: 453.032.101 50 634.1 96.132.1012 ?????? n s zx ? 即(100.867,101.773)。 (2)提出假設: 100:0 ??H , 100:1 ??H 計算檢驗的統計量: 712.5 50634.1 10032.1010 ? ? ? ? ? ns x z ? 由于 96.1712.5 205.0 ??? zz ,所以拒絕原假設,該批食品的重量不符合標準要求。 2.(1) 方差分析表 變差來源 df SS MS F Significance F 回歸 3 12026774.1 4008924.7 72.80 8.88341E-13 殘差 26 1431812.6 55069.7 — — 總計 29 13458586.7 — — — (2)多元線性回歸方程為: 321 5012.06107.808861.1171025.7589? xxxy ???? 。 8861.117? 1 ??? 表示:在年人均收入和廣告費用不變的情況下,銷售價格每增加 一個單位,銷售量平均下降 117.8861 個單位; 6107.80? 2 ?? 表示:在銷售價格和廣告費用 不變的情況下,年人均收入每增加一個單位,銷售量平均增加 80.6107 個單位; 5012.0? 3 ?? 表示:在年銷售價格和人均收入不變的情況下,廣告費用每增加一個單位,銷售量平均增加 0.5012 個單位。 (3)由于 Significance F=8.88341E-13< 05.0?? ,表明回歸方程的線性關系顯著。 10 (4) %36.89 7.13458586 1.120267742 ??? SST SSR R ,表明在銷售量的總變差中,被估計的多元 線性回歸方程所解釋的比例為 89.36%,說明回歸方程的擬合程度較高。 (5) 67.2347.55069 1 ??? ?? ? MSE kn SSE se 。表明用銷售價格、年人均收 入和廣告費用來預測銷售量時,平均的預測誤差為 234.67。 3. 解:分別記元件 , ,A B C 正常工作為事件 , ,A B C ,由已知條件可得 ( ) 0.8, ( ) 0.9, ( ) 0.9P A P B P C? ? ? 記系統 1 N 正常工作為事件 1 N ,則有 1 1 ( ) ( )P P N P ABC? ? ; 由于事件 , ,A B C 相互獨立,所以 1 ( ) ( ) ( ) 0.8 0.9 0.9 0.648P P A P B P C? ? ? ? ? 記系統 2 N 正常工作為事件 2 N ,則有 ? ?? ?2 2 ( )P P N P A B C? ? ? ? ; 由于 , ,A B C 相互獨立,則有 ? ?? ? ? ? 2 ( ) [1 ( ) ( )] ( ) 1 1 ( ) 1 ( ) 0.8 1 0.1 0.1 0.792 P P A P B P C P A P B P C? ? ? ? ? ? ? ?? ?? ? ? ? ? ? ?
免責聲明:本文系轉載自網絡,如有侵犯,請聯系我們立即刪除,另:本文僅代表作者個人觀點,與本網站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
|