分孩次生育率與人口總量關(guān)系探究數(shù)學(xué)專業(yè)畢業(yè)論文
《分孩次生育率與人口總量關(guān)系探究數(shù)學(xué)專業(yè)畢業(yè)論文》由會(huì)員分享,可在線閱讀,更多相關(guān)《分孩次生育率與人口總量關(guān)系探究數(shù)學(xué)專業(yè)畢業(yè)論文(21頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、 (2013屆) 本科畢業(yè)設(shè)計(jì)(論文) 題 目 名 稱: 分孩次生育率與人口總量 學(xué) 院(部): 理學(xué)院 專 業(yè): 數(shù)學(xué)與應(yīng)用數(shù)學(xué) 學(xué) 生 姓 名: 班
2、 級(jí): 應(yīng)數(shù)091 學(xué)號(hào):09411300136 指導(dǎo)教師姓名: 職稱:副教授 最終評(píng)定成績(jī): 年 月 湖南工業(yè)大學(xué) 本科畢業(yè)論文(設(shè)計(jì)) 誠(chéng)信聲明 本人鄭重聲明:所呈交的畢業(yè)論文(設(shè)計(jì)),題目《……》是本人在指導(dǎo)教師的指導(dǎo)下,進(jìn)行研究工作所取得的成果。對(duì)本文的研究作出重要貢獻(xiàn)的個(gè)人和集體,均已在文章以明確方式注明。除此之外,本論文(設(shè)計(jì))不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過(guò)的作品成
3、果。本人完全意識(shí)到本聲明應(yīng)承擔(dān)的責(zé)任。 作者簽名: 日期: 年 月 日 分孩次生育率與人口總量 摘 要 這篇文章大體上需要解決的問(wèn)題是怎樣由分孩次生育率的數(shù)據(jù)以及人口總量的數(shù)據(jù)來(lái)大致取得兩個(gè)數(shù)據(jù)之間函數(shù)關(guān)系,以此來(lái)表示這兩個(gè)變量之間的關(guān)系,并以此來(lái)作為人口統(tǒng)計(jì)的一個(gè)參考. 大體上的研究思路是這樣的:對(duì)于分孩次生育率來(lái)說(shuō),通過(guò)決策分析的一些研究方法,并利用各年的分孩次生育率的數(shù)據(jù)得到加權(quán)之后的總和生育率數(shù)據(jù)(此篇文章是通過(guò)基于離差最大化的決策方法來(lái)獲取權(quán)值),并以這個(gè)數(shù)據(jù)作為由分孩次生育率數(shù)據(jù)所得到的生育率數(shù)據(jù).其次是獲得人口總量的
4、數(shù)據(jù)(國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)庫(kù)中查到).最后是把這兩個(gè)數(shù)據(jù)進(jìn)行擬合,這里將采用最小二乘法以及多變量數(shù)據(jù)擬合的方法來(lái)獲取這兩個(gè)數(shù)據(jù)之間的關(guān)系.并比較這兩個(gè)方法之間的優(yōu)劣,使得最終的結(jié)果更加直觀的呈現(xiàn)出來(lái)! 關(guān)鍵詞:分孩次生育率;離差最大化;最小二乘法;多變量的數(shù)據(jù)擬合 ABSTRACT This article generally need to solve the problem is how from the parity fertility data and population data
5、to approximate function to obtain the relationship between the two data, in order to express the relationship between the two variables, and to serve as a reference population statistics. Research ideas in general is this: for the parity fertility rate, through some of the decision analysis method,
6、 and the years of the parity fertility data are weighted after the total fertility rate data (this article is through the deviation decision method based on maximum to obtain weights), taking the data as obtained from the parity fertility data fertility data. Second is to obtain the total population
7、 data (National Bureau of statistics database to check). Finally, thefitting of the two data, uses the least square method and the fitting method Of multivariate data to obtain the relationship between the two data. And a comparison between these two methods, so that the final results more intuitiv
8、e! Presentation Keywords: the parity fertility rate; maximum deviation; least square method; data fitting multivariate 目 錄 摘 要 3 Abstract 4 1 引言 6 2 人口總量 6 3 婦女生育率 7 3.1婦女生育率的定義 7 3.2婦女生育率的獲取 9 4 分孩次生育率與人口總量 11 4.1 最小二乘法 12 4.2 多變量的數(shù)據(jù)擬合 15 小
9、 結(jié) 19 參考文獻(xiàn) 19 致謝 20 湖南工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)(論文) 1 引言 自古以來(lái)我國(guó)一直是一個(gè)人口大國(guó),如此大量的人口基數(shù)確實(shí)對(duì)我國(guó)的發(fā)展延續(xù)以及文化傳承做出了莫大的貢獻(xiàn),但是也必須看到人口過(guò)多所帶來(lái)的如環(huán)境及資源的問(wèn)題?;谝陨系脑?我認(rèn)為研究人口總量對(duì)于一個(gè)民族來(lái)說(shuō)是非常重要的!然而影響人口總量的因素是非常多的,其中分孩次的婦女生育率是影響人口總量的一個(gè)至關(guān)重要的因素,對(duì)于婦女生育率來(lái)說(shuō),采用給分孩次的生育率加權(quán)的方式去獲取婦女生育率能更加直觀的把各孩次生育率的重要性程度體現(xiàn)出來(lái),使之能更真實(shí)的反映婦女生育率水
10、平的情況.從國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)庫(kù)可以查詢各年的人口總量.最后數(shù)據(jù)的擬合,用兩種方法進(jìn)行數(shù)據(jù)的擬合,并比較那種方法更加的合適. 2 人口總量 我國(guó)有著五六千年的文明歷史,一直是以開放,強(qiáng)大而文明。而這所有的一切都來(lái)自于各民族人的共同努力!眾所周知,我國(guó)長(zhǎng)久以來(lái)都是擁有龐大的人口基數(shù),這是我們國(guó)家的基礎(chǔ),也是我國(guó)的優(yōu)勢(shì),對(duì)于中華民族的傳承繁衍來(lái)說(shuō)都是至關(guān)重要的。人口基數(shù)大確實(shí)是優(yōu)勢(shì),但從長(zhǎng)遠(yuǎn)來(lái)看卻不能適應(yīng)時(shí)代的發(fā)展,這是需要我們特別注意的地方. 處理龐大的人口數(shù)據(jù)需要有極大地耐心和優(yōu)秀的數(shù)據(jù)處理能力,這里為了減小由于人口統(tǒng)計(jì)所帶來(lái)的問(wèn)題,將把人口單位設(shè)置為以萬(wàn)人為單位,這樣雖
11、然會(huì)使計(jì)算的精度有所下降,但這不會(huì)帶來(lái)特別大的影響。而且國(guó)家統(tǒng)計(jì)局的一些數(shù)據(jù)也只是精確到萬(wàn)人,因此由于上述的原因而采用萬(wàn)人為單位。為了彌補(bǔ)由于精度降低而帶來(lái)的數(shù)據(jù)損失,我在小數(shù)點(diǎn)的后面加上了兩位的有效數(shù)字。在盡可能降低計(jì)算的繁瑣程度的同時(shí),也盡可能地在一定程度上保證了人口數(shù)據(jù)的穩(wěn)定性,用以降低數(shù)據(jù)誤差而帶來(lái)的結(jié)果的誤差過(guò)大。 在這篇文章之中截取的年份人口的數(shù)據(jù)時(shí)從2005年一直到2011年七年之間的年份數(shù)據(jù),而下文婦女生育率的截取年份也是從2005年的數(shù)據(jù)到2011年數(shù)據(jù)的。人口數(shù)據(jù)是從國(guó)家統(tǒng)計(jì)局的官方網(wǎng)站中查詢得到的,主要的來(lái)源是網(wǎng)站中的中國(guó)人口統(tǒng)計(jì)年鑒[1]以及中國(guó)統(tǒng)計(jì)年鑒[2] 的
12、數(shù)據(jù)。 人口的數(shù)據(jù)是從中國(guó)統(tǒng)計(jì)年鑒[2]上查詢而得,查看統(tǒng)計(jì)局官網(wǎng)的結(jié)果,得到2005年到2011年的人口數(shù)據(jù),查詢而得的人口數(shù)據(jù)如下: 2005年 2006年 2007年 2008年 2009年 2010年 2011年 人口(萬(wàn)) 130756 131448 132129 132802 133450 134091 134735 采用上面所提到的給每年的人口數(shù)據(jù)都在小數(shù)點(diǎn)后面的加上兩位有效數(shù)字提高精度的辦法,得到的處理之后的人口數(shù)據(jù),結(jié)果如下表(單位:萬(wàn)): 2005年 2006年 2007年 2008年 2009年 2010年 2
13、011年 人口 130756.00 131448.00 132129.00 132802.00 133450.00 134091.00 134735.00 經(jīng)過(guò)上述方法的處理,結(jié)果即是從2005年到2011年人口的總數(shù),人口總數(shù)的統(tǒng)計(jì)就告一段落,接下來(lái)是處理婦女生育率的問(wèn)題。 3 婦女生育率 3.1婦女生育率的定義 這篇文章主要使用的生育率是分孩次的婦女生育率,但是為了更好的體現(xiàn)婦女生育率的全面情況,也對(duì)一般婦女生育率以及分年齡組的婦女生育率也做了適當(dāng)?shù)慕榻B。 定義3.1.1[3]:一般生育率(General Fertility Rate),一般說(shuō)來(lái)指
14、的是在一段期限內(nèi)(大體上為1年內(nèi))平均一千名育齡婦女中出生人數(shù)的比率.在這之中的育齡婦女主要是指15歲到49歲這一年齡階段的女性,基本情況是,只要是處于這個(gè)年齡段之中的婦女,不去考慮她是否婚配 ,不去考慮她是否能夠孕育后代,這樣的婦女都是屬于育齡婦女的.一般生育率的基本表達(dá)式為: ; 各個(gè)數(shù)據(jù)所代表的意思:B為1年之中出生嬰兒數(shù)量的總和;W為育齡婦女年中人數(shù),相當(dāng)于和出生人口數(shù)相應(yīng)年份的育齡婦女年平均人數(shù).由這個(gè)公式就可以計(jì)算出一般生育率。 定義3.1.2[3]:分孩次生育率, 一般說(shuō)來(lái)指的是一段期限內(nèi)(大體上為1年內(nèi))平均一千名育齡婦女中分孩次的出生人數(shù)的比率.大體上劃分為一孩
15、生育率,二孩生育率,三孩及以上生育率. 1. 一孩生育率是指一孩生育嬰兒數(shù)的出生比率: ; 公式之中的指的是1年之中一孩出生人數(shù)(下文中的一孩),W指的是育齡婦女年中人數(shù). 2. 二孩生育率是指二孩生育嬰兒數(shù)的出生比率: ; 公式中的指的是1年內(nèi)二孩出生人數(shù)(下文中的二孩), W指的是育齡婦女年中人數(shù). 3. 三孩及以上生育率是指三孩及以上生育嬰兒數(shù)的出生比率: ; 公式之中指的是1年內(nèi)三孩及以上出生人數(shù)(下文中的三孩),W指的是育齡婦女年中人數(shù). 定義3.1.1[4]:分年齡組生育率,又被稱為年齡別生育率或者說(shuō)是按齡生育率,與一般生育率的區(qū)別在于它是以某一年齡組的婦女為總
16、體的。它是指在一段時(shí)間內(nèi)(通常是一年內(nèi))該年齡組婦女生育的嬰兒數(shù)與該年齡段婦女的年平均人數(shù)的比值。其表達(dá)式為: 式中:為歲育齡婦女的生育率;為歲育齡婦女的年內(nèi)出生人數(shù);為歲育齡婦女的年平均人數(shù)。 以上就是三種婦女生育率的定義。 3.2婦女生育率的獲取 文章采用的生育率分孩次的婦女生育率,數(shù)據(jù)可以直接從國(guó)家統(tǒng)計(jì)局的文獻(xiàn)中查詢得到,再用決策分析中的離差最大化的方法對(duì)分孩次生育率進(jìn)行決策。 3.2.1 分孩次生育率 在國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)庫(kù)中查詢得到中國(guó)人口統(tǒng)計(jì)年鑒[1]以及中國(guó)統(tǒng)計(jì)年鑒[2]上歷年分孩次生育率的實(shí)際情況,這個(gè)即是各年分孩次生育率的情況(七年),查詢得到的各年數(shù)據(jù)
17、如下表: 2005年 2006年 2007年 2008年 2009年 2010年 2011年 一孩 21.68 23.02 25.04 26.22 24.24 20.71 19.75 二孩 10.90 10.62 11.05 11.18 10.60 10.42 8.72 三孩 1.85 1.36 1.37 1.43 1.30 2.18 1.29 基于從國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)庫(kù)之中所獲取的分孩次生育率的數(shù)據(jù)采用基于離差最大化的決策分析方法來(lái)取得婦女生育率加權(quán)生育率作為婦女生育率.以便體現(xiàn)各孩次生育率對(duì)于婦女生育率貢獻(xiàn)的真實(shí)水平.提取各孩
18、次的綜合貢獻(xiàn)值. 3.2.2 基于離差最大化的決策方法[5] 多屬性決策,一般是對(duì)決策的方案綜合屬性值得排序比較,如果在某屬性下決策的方案屬性值的差距越小,則越說(shuō)明該屬性的排序的作用越小。反之則說(shuō)明該屬性對(duì)于排序來(lái)說(shuō)起著更大的作用。因此,從方案排序的方面來(lái)講,偏差值越大的屬性應(yīng)該賦予更大的權(quán)重。特別的,若所有方案在某一屬性下的屬性值無(wú)差異,則該屬性對(duì)于方案的排序來(lái)說(shuō)是不起任何作用,可令其權(quán)重為0[6],而離差最大化的方法正是在這一前提條件下通過(guò)計(jì)算方案的離差,并求解方案的離差模型達(dá)到最優(yōu)值而求解出最終的結(jié)果。 但是考慮到本篇文章的特殊性,即不需要對(duì)方案進(jìn)行最后的
19、排序,只需要在計(jì)算出權(quán)重屬性后計(jì)算出各年的決策屬性值即可,因此舍去了決策分析的最后過(guò)程,具體的步驟[4]如下: 步驟1 對(duì)于一個(gè)多屬性決策問(wèn)題,我們首先需要做的是要構(gòu)造一個(gè)決策矩陣,并利用適當(dāng)?shù)姆椒ò阉?guī)范化為.規(guī)范化的方法為:如果屬性權(quán)重的類型是效益型,即屬性值越大越好的屬性,那么: ;或者; 若屬性權(quán)重值是成本型,也就是說(shuō)屬性值越小越好的屬性,那么: ;或者; 其中,N為各個(gè)方案,I為屬性. 效益型以及成本型; 由此得到我的規(guī)范化矩陣. 步驟2 .利用公式 . 計(jì)算出各方案的最優(yōu)權(quán)重向量,屬性權(quán)重值就算出來(lái)了 步驟3 根據(jù)上一步所計(jì)算出來(lái)的屬性權(quán)重值給各個(gè)
20、方案進(jìn)行加權(quán) . 以此計(jì)算出來(lái)的結(jié)果即是每個(gè)屬性的綜合決策屬性值。 由于本文并不需要對(duì)各年的婦女生育率屬性進(jìn)行排序,所以最后的步驟也就是排序的步驟就省略了。 3.2.3 由計(jì)算所得的決策權(quán)重計(jì)算各年的綜合決策值 步驟1 由上述提到的離差最大化的決策步驟計(jì)算得出本文之中的婦女生育率的規(guī)范化矩陣如下表,考慮到我國(guó)的實(shí)際情況是既要保證繁衍,又不能是人口總量超過(guò)環(huán)境的承載能力,在這種情況下我認(rèn)為把一孩生育率設(shè)置為效益型,而把二孩生育率與三孩生育率設(shè)置為成本型。 2005年 2006年 2007年 2008年 2009年 2010年 2011年 一孩 0.826
21、85 0.87796 0.955 1 0.92449 0.78986 0.75324 二孩 0.8 0.82109 0.78914 0.77996 0.82264 0.83865 1 三孩 0.6973 0.94853 0.62844 0.9021 0.99231 0.59174 1 這就是利用上文提到的規(guī)范化方法而計(jì)算出的規(guī)范化矩陣 步驟2 計(jì)算得出規(guī)范化矩陣后就可以直接利用公式求出決策屬性值,但是為了更加直觀的求解出決策屬性的權(quán)重值,我將先計(jì)算出公式的上半部分也就是要計(jì)算 計(jì)算出的矩陣如下表: 2005年 2006年 20
22、07年 2008年 2009年 2010年 2011年 一孩 0.56056 0.50954 0.6476 0.8726 0.55607 0.67162 0.85472 二孩 0.31328 0.29219 0.34586 0.39176 0.29374 0.34177 1.14852 三孩 1.22816 1.06979 1.43474 1.02336 1.20113 1.61824 1.23958 然后再利用公式計(jì)算出決策權(quán)重,決策權(quán)重為:屬性一孩生育率的決策權(quán)重值是=0.2812,屬性二孩生育率的決策權(quán)重值是=0.18834,屬性
23、三孩生育率的決策權(quán)重值是=0.53046. 步驟3 根據(jù)離差最大化決策方法的決策方法以及上一步的決策權(quán)重值計(jì)算出各年的加權(quán)之后的婦女生育率,計(jì)算的結(jié)果如下: 2005年 2006年 2007年 2008年 2009年 2010年 2011年 生育率 0.753578 0.904684 0.750535 0.906626 0.941283 0.693954 0.930611 這就是給各年的分孩次生育率賦予權(quán)值之后的結(jié)果,仔細(xì)的分析觀察之后可以看到這個(gè)結(jié)果確實(shí)有其不合理的地方,一個(gè)是得到的數(shù)值太小了,與人口總量的數(shù)量級(jí)差距是比較大的,這樣就會(huì)對(duì)擬
24、合的函數(shù)造成較大的影響。另外這也不太符合實(shí)際情況,一般說(shuō)來(lái)我國(guó)的婦女生育率是必然要大于一的,為了適當(dāng)?shù)臏p少這兩個(gè)問(wèn)題對(duì)結(jié)果造成的影響,必然要對(duì)這個(gè)數(shù)據(jù)做適當(dāng)?shù)奶幚?,以期適當(dāng)?shù)臏p少這個(gè)問(wèn)題帶來(lái)的結(jié)果不準(zhǔn)確的影響。我采用的放大倍數(shù)是3倍,這是考慮到這里有三種決策屬性。也就是說(shuō) 由上面的修正公式對(duì)結(jié)果進(jìn)行適當(dāng)?shù)男拚?,修正的結(jié)果如下: 2005年 2006年 2007年 2008年 2009年 2010年 2011年 生育率 2.260734 2.714051 2.251605 2.719877 2. 823849 2.081863 2.791833 修正的結(jié)
25、果在一定程度上彌補(bǔ)了數(shù)據(jù)過(guò)小的問(wèn)題,但是這數(shù)據(jù)在體現(xiàn)個(gè)孩次生育率對(duì)于總生育率的貢獻(xiàn)上是比一般的數(shù)據(jù)更好的。這樣就是最終的婦女生育率。至此已經(jīng)把該篇文章的兩種數(shù)據(jù)都處理完畢了,可以進(jìn)行這兩個(gè)數(shù)據(jù)的數(shù)據(jù)擬合了。 4 分孩次生育率與人口總量 數(shù)據(jù)的擬合采用的方式是最小二乘法[7]以及多變量的數(shù)據(jù)擬合[7]的方法來(lái)進(jìn)行處理。最小二乘法適于求解線性的數(shù)據(jù)擬合,為使結(jié)果更加的豐富多彩,再采取多變量數(shù)據(jù)擬合的方法與最小二乘法所擬合出來(lái)的函數(shù)做一個(gè)比較,看哪種方法更加的適合。 4.1 最小二乘法 接下來(lái)我會(huì)利用最小二乘法來(lái)擬合這兩個(gè)數(shù)據(jù)之間的函數(shù)關(guān)系,并以此來(lái)作為最終的
26、結(jié)果。與插值問(wèn)題相比,最小二乘法并不要求函數(shù)通過(guò)所有的節(jié)點(diǎn),只需要在曲線的附近即可,比較好的解決了由于觀測(cè)數(shù)據(jù)不準(zhǔn)確而帶來(lái)的誤差。只是畫出一條近似的曲線,反映給定問(wèn)題的一般趨勢(shì)而已,就、比插值函數(shù)更適于本文的操作。也不會(huì)產(chǎn)生像拉格朗日插值公式所帶來(lái)的隆格現(xiàn)象。而且由于本文兩個(gè)變量的數(shù)據(jù)之間數(shù)量級(jí)的差距較大,且數(shù)據(jù)之間的變化比較平滑,可以近似的認(rèn)為是一條直線,只用線性的就可以了。 由圖像可以看到確實(shí)點(diǎn)都近似在一條直線的兩側(cè)的。 4.1.1 最小二乘法簡(jiǎn)介 假設(shè)給定了一組函數(shù)節(jié)點(diǎn)
27、 現(xiàn)在要找一條直線使該直線在節(jié)點(diǎn)的附近。 一般來(lái)說(shuō)滿足條件的線性方程是很多的,需要選擇出一條最好的直線來(lái)契合條件,因此需要用某種方法把直線方程的,確定下假設(shè)已經(jīng)有某種方法把兩個(gè)系數(shù)固定下來(lái)了,這是有了的直接可以把的值算出來(lái)了,為: 當(dāng)然這樣得到的和不一定相同,所以把這兩個(gè)數(shù)據(jù)的差值記為 這個(gè)數(shù)值稱為誤差,也稱數(shù)據(jù)剩余。在原始的數(shù)據(jù)給定了之后,誤差就只與,的選取有關(guān)了。因此,把誤差的大小作為衡量,好壞的主要指標(biāo)。最小二乘法就是確定最好參數(shù)的方法之一,其原理是讓誤差的平方和達(dá)到最小,也就是說(shuō)要求 為最小。這個(gè)原理也是符合
28、一般的想法的,由于這些誤差都是實(shí)數(shù),他們的平方和是正數(shù),要使這些誤差的和盡可能的小也就保證了這些誤差的絕對(duì)值盡可能的小。數(shù)學(xué)上的最小值點(diǎn)也就是滿足條件的直線的最小二乘解。 為了求解出,的最好的值,把式子 帶入到式子 中,并且讓 現(xiàn)在需要解決的問(wèn)題是,怎樣去選擇,使達(dá)到最小??梢杂脭?shù)學(xué)分析中求極值的辦法,即求出后,對(duì),求偏微商,再使偏微商等于0,得到,應(yīng)該滿足的方程 即 這倆個(gè)方程稱為那些直線系數(shù)的正規(guī)方程組。解方程 可以得出和,直線方程 就可以確定出來(lái)了。最終的結(jié)果就求解出來(lái)了. 總結(jié)前面的簡(jiǎn)介,現(xiàn)將上面的例子的計(jì)算步驟整理如下: 第一步:由數(shù)據(jù),計(jì)
29、算以及,列成一個(gè)表格。 第二步:將表中每列的數(shù)據(jù)相加之后寫在表格的最后一行。 第三步:寫出正規(guī)方程。 第四步:解方程組求出和。 4.1.2 系數(shù)設(shè)置 在這篇文章中主要涉及到兩個(gè)變量,一個(gè)是人口總量,另一個(gè)是婦女生育率.但是人口總量的數(shù)量級(jí)是比較大的,如果是把人口總量作為自變量,婦女生育率作為因變量就會(huì)導(dǎo)致計(jì)算出的拉格朗日型插值函數(shù)的數(shù)量級(jí)過(guò)高而導(dǎo)致計(jì)算出的結(jié)果太大.因此我把人口總量作為因變量y,把婦女生育率作為自變量x,這樣既不會(huì)導(dǎo)致數(shù)量級(jí)太大而影響精度,也方便了計(jì)算. 各年的婦女生育率按2003年到2011年的順序分別設(shè)置為(i=0,1,…,8),把人口總量按2003年2011年
30、的順數(shù)分別設(shè)置為(i=0,1,…,8). 4.1.3 最小二乘法數(shù)據(jù)擬合 根據(jù)前面的步驟,第一步是要繪制出表格,由上面的條件得出的表格如下: 編號(hào) 1 2.260734 130756.00 5.110918219 295604.5349 2 2.714051 131448.00 7.366072831 356756.5758 3 2.251605 132129.00 5.069725076 297502.317 4 2.719877 132802.00 7.397730895 361205.1054 5 2.823849 13
31、3450.00 7.974123175 376842.6491 6 2.081863 134091.00 4.334153511 279159.0915 7 2.791833 134735.00 7.7943315 376157.6193 17.643812 929411.00 45.04705525 2343227.893 這篇文章的正規(guī)方程是 把上表格的數(shù)據(jù)代入到這個(gè)正規(guī)方程里面,則有: 根據(jù)這兩個(gè)方程組就可以求解出和。 采用代入法消元得到: =130115.4504,=1054.355455。 所以,計(jì)算出來(lái)的線性方程是: 為
32、了降低計(jì)算量,此處計(jì)算出的結(jié)果只精確到小數(shù)點(diǎn)后面的兩位,因此降低計(jì)算量值后的線性方程是: 接下來(lái)就是驗(yàn)證,解出的線性方程組的效果是否足夠,這里利用2003年的數(shù)據(jù)進(jìn)行驗(yàn)證,查詢得到2003年的一孩生育率是26.12,二孩生育率是10.10,三孩生育率是1.79。而2003年的人口總量是129227萬(wàn)人。把生育率數(shù)據(jù)放入到前面的離差最大化的決策步驟中,得到加權(quán)之后的婦女生育率是2.475,把2.475代入到上面的線性方程中,得到人口總量的數(shù)據(jù)是132724.991,與當(dāng)年的129227萬(wàn)的人口相比,多出了3498萬(wàn),可以看多數(shù)據(jù)還是比較接近,這說(shuō)明在人口增長(zhǎng)相對(duì)穩(wěn)定的狀況下,利用最小二乘法
33、求解人口總量是比較精確的。 4.2 多變量的數(shù)據(jù)擬合[7] 上面已經(jīng)利用最小二乘法求解分孩次生育率與人口總量的線性函數(shù)關(guān)系了,發(fā)現(xiàn)利用最小二乘法求解的結(jié)果是比較精確的。下面就用多變量的數(shù)據(jù)擬合的對(duì)數(shù)據(jù)進(jìn)行擬合,這里不需要對(duì)婦女生育率做加權(quán)處理了,直接把一孩生育率,二孩生育率,三孩生育率看做是三個(gè)變量,也就是把他們作為影響函數(shù)值的三個(gè)因素。與上面的結(jié)果進(jìn)行比較。上文也已經(jīng)提到了,由于人口與婦女生育率的相對(duì)穩(wěn)定,大致上來(lái)說(shuō),是呈現(xiàn)線性關(guān)系的,因此采用多變量的數(shù)據(jù)擬合的方法對(duì)于這個(gè)問(wèn)題來(lái)講,也是比較合適的。至于系數(shù)的設(shè)置問(wèn)題,由于條件的改變,需要從新設(shè)定,前面的已經(jīng)不適用。 4.2.1
34、 多變量的數(shù)據(jù)擬合的簡(jiǎn)介 多變量的數(shù)據(jù)擬合的辦法,主要針對(duì)的是多個(gè)變量同時(shí)對(duì)一個(gè)數(shù)據(jù)產(chǎn)生影響的情況。具體操作如下: 如果說(shuō)影響變量y的因素不是只有一個(gè),而是有幾個(gè),比如說(shuō)有k個(gè)因素,,,同時(shí)對(duì)變量y產(chǎn)生影響,這是通過(guò)查詢得到的n組數(shù)據(jù)可以得到下表: 編號(hào) 1 2 N 在一般的情況下來(lái)說(shuō)>,如果選擇的是近似方程為 和前面提到的一樣,把數(shù)據(jù)代入方程之后將得到一個(gè)矛盾方程組,所以這里任然利用最小二乘法的原理來(lái)確定方程 中的全部系數(shù)。使得 要求要使得達(dá)到極小。
35、將式子 分別對(duì),,,求偏微商,而且分別令,,,的偏微商等于0.就得到 也就是說(shuō): 這也是一個(gè)正規(guī)方程組。當(dāng)然這個(gè)這個(gè)正規(guī)方程組經(jīng)過(guò)簡(jiǎn)化整理可以得到另一種形式,該形式如下: 在這之中 =1,2, ,k, =1,2, ,k. , ,=1,2, ,k. 通過(guò)求解線性方程組 即可以求得(=1,2, ,k),再?gòu)氖阶? 計(jì)算出,通過(guò)這兩個(gè)方程組就可以求得全部的系數(shù)了。 因?yàn)橥ǔN覀兗僭O(shè)觀測(cè)數(shù)據(jù)的數(shù)組大于自變量的個(gè)數(shù)(即N>K),并且假設(shè)任一自變量都不能用其他自變量的線性表出,這時(shí)方程總有唯一解。這就是多變量擬合的一般過(guò)程和原理,大體上看來(lái)與最小二乘
36、法是差不多的,只是變量的個(gè)數(shù)多了一些。接下來(lái)就是利用多變量數(shù)據(jù)的擬合方法解決分孩次生育率與人口總量的數(shù)據(jù)擬合問(wèn)題。 4.2.2 多變量的數(shù)據(jù)擬合的系數(shù)設(shè)置 與前面的最小二乘法數(shù)據(jù)擬合相比,多變量的數(shù)據(jù)擬合問(wèn)題的系數(shù)有所不同,前面自由一個(gè)變量就是婦女生育率,而這里就涉及到了三個(gè)數(shù)據(jù)變量,他們分別是一孩生育率,二孩生育率,以及三孩生育率。同樣的,為了不使數(shù)據(jù)溢出影響精度,仍然把人口總量作為因變量,而把婦女生育率作為自變量,因此,在這里把人口總量設(shè)置為,把一孩生育率設(shè)置為,把二孩生育率設(shè)置為,把三孩生育率設(shè)置為。因此這里涉及到7組數(shù)據(jù)。 4.2.3 利用多變量的數(shù)據(jù)擬合求解 在前文中已經(jīng)已
37、經(jīng)查詢到了關(guān)于2005年直到2011年七年的人口總量以及這幾年的婦女生育的數(shù)據(jù),這些數(shù)據(jù)如下表所示: 編號(hào) 1 21.68 10.9 1.85 130756 2 23.02 10.62 1.36 131448 3 25.04 11.05 1.37 132129 4 26.22 11.18 1.43 132802 5 24.24 10.6 1.3 133450 6 20.71 10.42 2.18 134091 7 19.75 8.72 1.29 134735 現(xiàn)在選擇的近似方程是 這是一個(gè)線性方程,
38、現(xiàn)在用最小二乘法的原理來(lái)確定系數(shù),,,也就是要使得 取得極小值,為此,分別對(duì),,,求偏微商,而且令他們的偏微商為0.得正規(guī)方程組 由matlab解得 ans = 1.0e+005 * 1.4615 0.0107 -0.0428 0.0451 即=146150,=1070,=-4280,=4510。 程序代碼: A=[7,160.66,73.49,10.74;160.66,3720.98,1695.58,245.35;73.49,1695.58,775.66,113.48;10.78,245.35,113.48,17.3]; B=[929
39、411,21324171,9752657,1431203]; >>inv(A)*B 解得的近似方程為 =146150+1070-4280+4510 這里把多屬性的數(shù)據(jù)擬合函數(shù)解出來(lái)了,仍然要對(duì)其進(jìn)行檢測(cè),所選取得年份仍然是2003年,從上文可以看到2003年我國(guó)的一孩生育率是26.12,二孩生育率是10.1,三孩生育率是1.79,當(dāng)年的人口總量是129227萬(wàn)人,把分孩次生育率代入到剛才的近似方程中,解得的結(jié)果是138943.3萬(wàn),與實(shí)際人口數(shù)量的偏差為9716.3萬(wàn),誤差是比較大的,比直接用最小二乘法解得的數(shù)據(jù)誤差大一些,因此用最小二乘法解更加的合適。 小 結(jié) 本文利
40、用最小二乘法和多變量的數(shù)據(jù)擬合的方法來(lái)求解分孩次生育率與人口總量之間的函數(shù)關(guān)系,首先查詢得到歷年的人口數(shù)據(jù),然后是查詢得到歷年的婦女生育率的數(shù)值,利用離差最大化的決策方法來(lái)給分孩次的婦女生育率加權(quán),使各孩次的貢獻(xiàn)程度比較直觀的表示出來(lái)了。最后是分別用最小二乘法和多變量的數(shù)據(jù)擬合的方法分別擬合函數(shù),并做一個(gè)比較,最終的結(jié)果是使用最小二乘法的效果比使用多變量的數(shù)據(jù)擬合的方法誤差要小,在本文的條件下,使用最小二乘法來(lái)擬合函數(shù)是比較適合的。 參考文獻(xiàn) [1] 中國(guó)人口統(tǒng)計(jì)年鑒(1993年~2002年).國(guó)家統(tǒng)計(jì)局 [2] 中國(guó)統(tǒng)計(jì)年鑒(2003年~2011年).國(guó)家統(tǒng)計(jì)局
41、[3] 李勇勝. 人口統(tǒng)計(jì)學(xué).成都:西南財(cái)經(jīng)大學(xué)出版社,2002 [4] 溫勇.人口統(tǒng)計(jì)學(xué).南京:東南大學(xué)出版社,2006 [5] 徐澤水.不確定多屬性決策方法及應(yīng)用.北京:清華大學(xué)出版社,2004 [6] 王應(yīng)明. 應(yīng)用離差最大化方法進(jìn)行多指標(biāo)決策與排序. 系統(tǒng)工程與電子技術(shù),1998,20(7):24~26 [7] 徐萃微,孫繩武.計(jì)算方法引論,北京:高等教育出版社,2007 致謝 在論文結(jié)束之際,我要大力感謝李強(qiáng)老師對(duì)于本篇論文的嚴(yán)格審核,不厭其煩的指出了文章中的紕漏和錯(cuò)誤,并給與了我大量的指導(dǎo)意見,讓這篇存在著大量錯(cuò)誤和漏洞的拙文變得流利通暢,在這里,我要再次感謝李強(qiáng)老師一次次的辛勤付出,在百忙之中抽出時(shí)間指導(dǎo)我的寫作。在李強(qiáng)老師的幫助之下我順利完成了這篇文章.同時(shí)也非常感謝汪新凡老師、趙育林老師以及其他任課老師的幫助. 15
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 川渝旅游日記成都重慶城市介紹推薦景點(diǎn)美食推薦
- XX國(guó)有企業(yè)黨委書記個(gè)人述責(zé)述廉報(bào)告及2025年重點(diǎn)工作計(jì)劃
- 世界濕地日濕地的含義及價(jià)值
- 20XX年春節(jié)節(jié)后復(fù)工安全生產(chǎn)培訓(xùn)人到場(chǎng)心到崗
- 大唐女子圖鑒唐朝服飾之美器物之美繪畫之美生活之美
- 節(jié)后開工第一課輕松掌握各要點(diǎn)節(jié)后常見的八大危險(xiǎn)
- 廈門城市旅游介紹廈門景點(diǎn)介紹廈門美食展示
- 節(jié)后開工第一課復(fù)工復(fù)產(chǎn)十注意節(jié)后復(fù)工十檢查
- 傳統(tǒng)文化百善孝為先孝道培訓(xùn)
- 深圳城市旅游介紹景點(diǎn)推薦美食探索
- 節(jié)后復(fù)工安全生產(chǎn)培訓(xùn)勿忘安全本心人人講安全個(gè)個(gè)會(huì)應(yīng)急
- 預(yù)防性維修管理
- 常見閥門類型及特點(diǎn)
- 設(shè)備預(yù)防性維修
- 2.乳化液泵工理論考試試題含答案