回帖:从公安部全国公民身份号码查询服务中心的“全国公民身份信息系统”,得到的却是另一种结果。
中国使用人数最多的二十个大姓中,胡姓人口1370万,占总人口1.21% ,排在第14位。
大姓区域分布研究
中国人民大学人口与发展研究中心 吕利丹 段成荣
http://www.nciic.com.cn/framework/gongzuo/icffkkob-edie-bbno-lpph-lidenkagipgp.jsp
一.姓氏区域分布的研究背景
我是谁?我从哪里来?人们常常追问自己的生命源头,探源自己姓氏的来龙去脉。寻根念祖是人的本性,慎思追远也是中华民族的传统美德,汉人通常有着极强的宗族观念和血统意识。家族和血统的绵延也就是姓氏的绵延,中国人对姓氏的重视集中体现了对宗族的重视。
对姓氏的记载和归纳,历来受到高度重视,古人对姓氏的研究成果也是层出不穷。目前广为流传的以“赵钱孙李,周吴郑王”开头的《百家姓》,编者要追溯到宋代钱塘的一位秀才。之后的元、明、清等各个朝代都有比较完备的关于姓氏的位次排列和地区分布的资料。
随着社会的发展,姓氏经过不断的分化、发展、演变,逐渐形成了今天我们所使用的姓氏。对于姓氏使用方面的问题一直是人们比较关注却又无法回答的问题。比如:我国目前有多少姓氏?每个姓氏有多少人口?姓氏的排名先后是怎样的?这些姓氏是如何分布的?等等。公安部全国公民身份号码查询服务中心(以下称“中心”)利用“全国公民身份信息系统”对全国户籍人口的姓氏的统计为我们回答这些问题提供了数据基础。
根据中心提供的数据,本研究将使用人数最多的二十个姓氏(如表1)作为大姓的代表分析其地域性分布特征。
表1 中国使用人数最多的二十个大姓
二.姓氏区域分布的度量方法
本研究构造了两个指标对使用人数最多的二十个大姓的地区分布差异进行量化:姓氏分布集中系数和姓氏分布强度系数,此外,本文还引入mapinfo的绘图技术,在中国地图上将各大姓分布的地方特色形象直观的表现了出来。
1.姓氏分布集中系数
不同姓氏的地区分布不均衡程度有所不同,这种差异可以用姓氏分布集中系数(XCI)来量化比较。姓氏分布集中系数(XCI)反映的是姓氏地区分布相对于人口地区分布而言的集中程度。系数数值越大,姓氏分布越不均匀;系数数值越小,姓氏分布越均匀。计算公式为XCI=∑│Xi-Si│/2,其中Xi是该姓氏在地区i的使用人数占该姓氏全国使用人数的百分比,Si是地区i的汉族人口占全国汉族总人口的百分比。
如表2所示,我们计算出了前20个大姓的分布集中系数。由表可知,不同姓氏的集中程度迥然有别。林姓的分布集中系数最高,达0.53,说明二十个大姓中,相对于人口地区分布而言,林姓分布最不均匀,如果要使林姓使用人口的地区分布与人口地区分布相同,即各省的林姓人口占全国林姓人口的比例与各省人口占全国总人口的比例相同,那么全国有53%的林姓人口需要跨省搬家。也就是说,全国1136万林姓人口中有602万林姓人口需要搬出自己的原有省份,到他省定居。二十个大姓中,分布集中系数最小的为李姓,有0.10,表示有10%的李姓人口,也就是8313万李姓人口中的831万人需要跨省搬家才能使全国的李姓使用人口分布与总人口分布相同。
从表1还可知,二十个大姓中,位次都排在前六位的王李张刘杨五大姓氏,其分布集中系数却排在最后五位,说明,这几个大姓的地区分布反而较均匀。
表2二十个大姓姓氏分布集中系数
2.姓氏在各省区使用人数占全省人口百分比示意地图
我们利用姓氏在各省的人口数占全省人口数的百分比绘制了20个姓氏的地图,颜色的深浅代表了百分比的大小,颜色越深,表示所占百分比越大。见地图的图例,该系列地图以31个省市百分比的平均数为基础,以百分比的标准差为间距,将所有的百分比分为六个百分比段,平均数上下各三段,用六种不同深浅的颜色来表示。
具体到各姓氏,图例中百分比段的划分可能会随具体情况有所调整。个别姓氏在某些百分比段的省区数