知识细颗粒资源库

上篇中国姓氏群体遗传

知识类型：析出资源

内容出处：	《中国姓氏群体遗传和人口分布》图书
唯一号：	131020020210012247
颗粒名称：	上篇中国姓氏群体遗传
分类号：	K810.2
页数：	74
页码：	1-74
摘要：	中国姓氏群体遗传概述了姓氏群体遗传学是人类群体遗传学的一个分支，是利用人类姓氏的特定传递规则，研究姓氏在人群中的分布，进而分析人群间的亲缘关系和历史上人群迁移模式等。
关键词：	姓氏研究群体遗传

内容

姓氏群体遗传学是人类群体遗传学的一个分支，是利用人类姓氏的特定传递规则，研究姓氏在人群中的分布，进而分析人群间的亲缘关系和历史上人群迁移模式等。人类的姓在世界各地出现的时间相差很大，而且，其产生的文化背景也不同。世界上最早使用姓的国家是中国，大约在5000年前的伏羲氏时代，姓被定为世袭，由父系传递，中国人的姓是世界上最古老的。在世界其他地区，从姓的产生到普遍使用姓，是从大约公元1000年起的一个渐进发展的过程。在英国，当时由于名字不够用而产生使用姓的需要，这个过程延续了大约600年，才得以在大不列颠土地上普遍使用姓（《不列颠百科全书》第16卷，1999年）。因此，在欧洲大陆普遍使用姓的历史只有400年。在欧洲的有些地区直到20世纪，姓的使用尚未普遍。比如，到1935年土耳其人方以法律形式规定使用姓。犹太人很晚才使用姓，而且经常出于被迫，这是由于犹太人在当时所处的国际地位，不能使用基督徒的名字，尤其在德、意、奥地区。但有一个例外，在1000年前的北宋，由“丝绸之路”进入中国的犹太人定居河南开封，到明朝时已经被中国的文化所同化，全部采用了汉姓。犹太人不能忘记这一历史，是中国人给了他们祖先以姓，犹太人是西方最早有姓的民族之一。姓的形成常常是一个民族的历史和文化偏见的反映。在西班牙，姓的形成过程同党派、家族的自豪感有关，瑞典人的姓反映了瑞典人对大自然的热爱。与我国一水相隔的日本，在公元5世纪晚期开始产生了姓，但仅仅是代表社会政治结构中地位和职务的世袭称号（《不列颠百科全书》第9卷，1999年）。直到明治维新时期，1875年日本政府颁布了法令，实施户籍登记，要求每一个日本人必须有姓，日本人才急匆匆地为自己找姓，多以所居地名为姓，因此多为两字姓，这不同于中国人的复姓，日本人一下子涌现出30000多个姓，在日本这才真正地普及了姓，到今天，日本的姓已达120000多个（Yasu-da,1983;Lasker,1985）。中国人，尤其在汉族社会中，宗族观念根深蒂固，直到1949年前，同姓同宗在汉人观念中，仍是一种很强的联系纽带。实际上西周春秋以来，在宗法制度下，中国人的亲属是以父系为中心，论亲疏。父系家族的延续被认为是至关重要的事。祭祀祖宗，不断烟火，被认为是每个家庭的头等大事，无后被认为是最大的不孝。古代的国家观念，也与家族观念相联系，所谓一家一姓的天下，实际是父系家族观念的无限扩大。在这种宗法制度和宗族观念的几千年中，中国人十分重视姓，养成了同姓聚居的习俗，很多地区流传着修谱联宗的现象，在全国形成了无数群大小不等的同姓人群。中国人姓氏几乎都以父传子的垂直方式世代相传，女子婚后也不改姓，仅仅附上夫姓，表明已婚。所以，中国姓氏是中国几千年父系社会全过程的见证文化，以一种血缘文化的特殊形式记录了中华民族的形成和发展，在中华民族文化的同化过程和国家统一上曾经起过独特的民族凝聚力的作用。中国人姓氏是中国历史和特有的传统文化的反映，中国人的姓氏种类和分布也是一项重要的国情。研究和剖析中国人姓氏是我们的责任。本编主要向读者介绍，自然科学家是如何认识中国人姓氏的；中国人姓氏的特征是什么？用何方法收集姓氏和确认其科学研究的价值？历代中国人姓氏的分布规律，它们揭示了什么本质？中国人的姓氏有多少？直观的姓氏遗传地形图是如何表达的？
第一章绪论 1.1中国姓氏的起源姓，代表氏族的血统，最早起源于母系社会。早期的姓出自氏族的图腾，氏族往往以天象星座、动植物作为其图腾的内容，在与周边的其他氏族的交往中以展示氏族图腾的徽记来表明其身份，区别不同的氏族和方位，这氏族徽记就是姓的最早雏形。从时间上，姓的产生远远早于文字，有了文字以后，根据图腾徽记的图形产生了有文字意义上的姓。氏，是古代贵族标志宗族系统的称号，从夏朝中期开始，氏成为姓的支系，是私有制社会的特种产物，表示功勋和地位。先秦时女子称姓，男子称氏（郑樵《通志·氏族略》）。中国古代姓氏传说产生于远古五帝时期。从盘古氏开天地，历三皇、五龙氏，到伏羲氏定姓、氏，再经炎黄、尧舜时代，夏商周、春秋战国，到秦并六国，建立了中国第一个中央集权政权，姓、氏也混而为一。中国姓氏的历史至少有五千年之久。历来都以为中国人先有姓，后有氏。事实上，姓、氏一直在混合使用，姓和氏的关系也在转变。最早的氏为大氏族、部落、国家、氏族联盟的称呼。传说中和文献上出现的这类氏有上百个，最早的是盘古氏、天皇氏、地皇氏、人皇氏、五龙氏时代，随后为钜灵氏、黄神氏、鬼隗氏、空桑氏、次民氏等二十二氏的循蜚纪时代，接着为辰放氏、蜀山氏、混沌氏、有巢氏、燧人氏、庸成氏等十三氏的因提纪时代。在这个时期中，最重要的氏是有巢氏和燧人氏，有巢氏教民架木为巢，掘地为营；燧人氏发明了钻木取火，教人熟食，教民结绳以记事。之后进入了伏羲氏时代，这一时期中原地区出现了共工氏、柏皇氏、朱襄氏、昊英氏、栗陆氏、郝胥氏、昆吾氏、葛天氏、阴康氏、中皇氏、女娲氏等部落或国家。中国最早的姓就产生在伏羲氏时期，伏羲氏之后为风姓，这是中国第一个姓（范文澜《中国通史》，1978年）。这个时期的另一个重要的氏是中皇氏，中皇氏的首领为仓颉，他创造了文字，替代结绳记事。女娲氏之后为神农氏，即炎帝，其后为姜姓；黄帝姓公孙，名轩辕，号有熊氏，有熊氏是黄帝所在的部落和国的称呼，黄帝继承炎帝之位统治了中原大地。黄帝有二十五子，得姓者十四，有姓十二：姬、酉、祁、己、滕、葴（亦作箴）、任、荀、僖、姞、儇、依。这十二个姓事实上是有熊氏部落的分族，其他的儿子因没有实力建立起自己的族而不能有姓。这是姓为氏的支系的时代。黄帝与西陵氏女生子玄嚣，号青阳氏，亦名少昊，少昊氏族东迁，成为东夷族的首领，改称金天氏，其后为嬴姓、偃姓；黄帝与西陵氏女生次子昌意，昌意娶蜀山氏之女生颛顼，为高阳氏，其后为芈姓、己姓、董姓、妘姓、曹姓等；黄帝之曾孙帝喾为高辛氏，其后为子姓；帝喾之子尧为陶唐氏，其后为祁姓；黄帝之裔舜为有虞氏，其后为妫姓、姚姓；颛顼之孙禹为夏后氏，其后为姒姓。所以，氏在周朝之前是部落名、国名的一种表示，与周朝的氏的含义有很大的区别。中国最古老的姓基本都出自炎黄两帝之后，据文献统计，先秦时期总共出现过30多个姓，加上考古出土的西周铜器铭文上所见的姓，总数也没有超过50个，而氏的数目却远远超过了此数。夏朝时，氏的本意发生了变化，氏可以代表姓族中重要的分支，成为夏朝的诸侯。比如黄帝之孙颛顼帝之后的己姓，在夏朝分生出昆吾氏、苏氏、顾氏、温氏等氏族，并成为夏朝的诸侯国。夏朝时已经出现了分封制，禹为姒姓，其后分封有夏后氏、有扈氏、有男氏、斟寻氏、彤城氏、褒氏、费氏、杞氏、缯氏、辛氏、冥氏、斟氏、戈氏等诸侯国（司马迁《史记》）。商朝基本上继承了夏朝的制度。作为血缘关系的姓和氏之间发生最重要的变化是在西周初期，周武王灭商后，重新确立了姓、氏的关系，“天子建德，因生以赐姓，胙之土而命之氏”（左丘明《左传》）。姓明婚姻，世代不变；氏辨贵贱，随时更移。西周“裂土分封”同姓、异姓诸侯国1300余，天子尊为大宗，诸侯称为小宗。西周的宗法制规定：诸侯国君的嫡长子继承国位和爵位，一姓之祖由嫡长子来祭祀和继承，虽经百代而不变其姓，此即所谓大宗；国君嫡长子以外的儿子统称为庶子，也称别子，史称公子，他们不能继承君位，凡获得分封的另立一家，获得新氏，往往以封邑为氏，称为小宗。别子的嫡长子继承新氏族，为新氏族的大宗，而其他儿子须再立新的支氏族，往往封于乡、亭，以乡、亭为新支氏族。没有土地可以分封的儿子，或以先祖的号、谥、爵、官、名、字、居、事、职、次等为新氏族；五代以后降为庶民，无氏可立；国亡后的国君嫡系一族往往以国名为氏，或以所继承的姓为氏。氏是特权和地位的标志，大权有大氏，小权有小氏。春秋战国时产生了无数个氏，也衰亡了无数个氏，而姓是不能改变的。所以，先秦时保留下来的姓仅仅在30个左右，而保留下来的氏却有近千个。我们平时提到的姓氏几乎都出自西周、春秋、战国时期的氏，与夏商以前的氏是有区别的。直到秦始皇灭六国统一了中国，姓、氏才混合为一，汉朝以后姓和氏不再给予严格的区分（马雍，1985年）。促使姓、氏合一的根本原因，是秦始皇统一天下之后，所实施的“郡县制”取代了周朝的“裂土分封制”。秦朝的郡县制既没有国、邑、乡、亭、里五等世袭封土，也没有公、侯、伯、子、男五等爵位，皇亲国戚、功勋武将也没有自己的封土。宗法分封制度的灭亡，使原先代表贵贱的“氏”与区别婚姻的“姓”之间没有本质上的区别，氏与姓都只剩下标记血缘系统符号的作用。有关中国姓氏有史可查的既系统又可靠的记载，主要为秦汉以后的文献。正是在秦汉时期，才奠定了中国汉族姓氏世代稳定传递的基础。目前我们正在使用的汉族姓氏大约3000余个，但大约87％的汉族集中在100个大姓上，其中97个大姓源自春秋战国时期形成的氏，仅有任、姜、姚三姓出自炎黄时代的古姓（袁义达，1996年）。有一点可以肯定，姓虽然起源于母系氏族时期，但中国5000年姓和氏的传说和有限的文献记载表明：炎黄以来的姓和氏基本上都为父系传递下来的，这是中国汉族姓氏的遗传学的真谛。
1.2同姓人群的迁移与融合公元前21世纪，在黄河中游的河洛流域崛起了夏民族，这是汉民族形成的开始时期。以发源于黄河流域的炎黄部落的姜姓和姬姓为主体，融合了东夷部落的嬴姓和偃姓，形成了强大的华夏民族，以中原为中心，先后建立了夏、商、周三朝，长达2000多年之久。中国的姓氏经历了严格的宗法制度时期，到秦始皇统一了中国，实施的“郡县制”取代了周朝的“分封制”，建立了户籍制度，打破了姓与氏的固定模式，姓和氏不再是贵族和特权的专用字，普天之下的秦人，不分贵贱，都可以有姓氏，姓和氏混合为一。汉承秦制，华夏民族在这一伟大的转化中，由秦人变为汉人，逐步形成了汉民族，汉民族所拥有的姓氏就是汉姓。西汉的建立标志了汉民族的形成，汉民族是以华夏民族为主体，融合周边的民族进化而成。汉族姓氏以先秦时期形成的姓和氏为核心，吸收周边民族的姓氏，形成了同姓不同郡望的汉族新的姓氏传递和分布规律，这不同于先秦时期的华夏姓氏。这样，随着外族的不断融入，汉族姓氏进化的结果是著名姓氏的同姓人群的规模越来越大，大姓往往拥有多个郡望，以区别不同祖先所形成的同姓群体；姓氏的种类也随着总人口的扩大而增加，或随着总人口的缩小而减少。汉族人口从西汉初的3000多万，发展到明朝末的1亿，再发展到清朝道光年间的四亿，最终发展到今天的近12亿；汉族姓氏种类的数目由西汉初的1800多种，增加到明末的2200多种，再增加到清朝道光年间的2800多种，最终增加到今天的3500余种；从宋朝以来，李、王、张一直为我国人口最多的三大姓，三大姓的同姓人群的总人口在宋、元、明、当代四个时期占全国总人口的比例分别为21％、17％、18％、22％。有关中国姓氏有史可查的记录，主要是秦汉以后的文献。正是在秦汉时期，才奠定了中国姓氏延绵不断地稳定传递的基础。姓氏的真正含义是反映父系的血统。在这几千年里，大规模的人群迁移、民族融合和同化的进程与汉族姓氏的进化是同步的，当今汉族姓氏在全国分布特征是这几千年漫长历史进程的结果。自汉朝以来，汉民族与周边民族发生大规模融合至少有五次，汉姓也发生了五次重大的变革和发展，所经历的时代是汉朝、两晋南北朝、唐宋、元朝、清朝等。公元前202年汉高祖刘邦在河南荥阳即皇帝位，初建都于洛阳，不久迁陕西长安，汉朝宣告成立，史称西汉。到公元220年曹丕称魏帝，汉献帝让位，东汉灭亡，两汉历时422年。这时期的汉族所融合的周边民族的数目和人数是历史上最多的一次，是汉族第一次大融合时期。融入汉族的外民族包括北部的匈奴、鲜卑、乌桓、乌孙，东北的高句丽、扶余、濊貊、沃沮、三韩，东南的东越、闽越、山越、西瓯，南部的南越、骆越、外越、南蛮、交趾，西北的大月氏、羌、西域诸国，西南的叟、僰、冉駹、邛、蜀、巴等。这一时期，汉朝是世界上最强大的帝国，周边的民族和国家无不向往大汉帝国，与汉人通婚和杂居，并很快被汉化，成为汉族。汉民族能够长期占据统治地位，不间断地同化融入的其他民族，不断地加强汉民族的凝聚力，这与汉民族继承华夏族的一贯的民族协调、民族和亲的政策和推行汉化政策有关。民族间的通婚，上可追溯到4000多年前的炎黄两大部落间的世代通婚的时代，这一习俗一直延续到周朝，炎帝族的后裔姜姓与黄帝族的后裔姬姓仍世为婚姻。其他各国贵族之间的和亲通婚已经成为传统的习惯，比如姬姓鲁国与子姓宋国、嬴姓秦国与姬姓晋国的世代通婚，姬姓晋国的公族与戎族、狄族的通婚。到了春秋战国时期，华夏族的各国与周边的西戎、北狄、东夷、南蛮之间都存在这类通婚的现象和习俗。秦始皇统一了中国，统一了文字，统一了货币，制定了统一的度量衡，废除分封制等，有利于国家统一政策的推行。汉承秦制，不但加强了民族和亲的政策；更重要的是推行了汉化政策，规定讲汉语，统一用汉字。使不同地区，特别是南北之间讲不同方言的汉族统一在汉文之下，汉字的文化认同对于汉民族的内聚力、中华民族的凝聚力和国家的大统一起到了至关重要的作用。“没有汉字，就没有汉民族”，也就没有中国。以至于到今天，只要是中国人，不管在世界何地，讲何种中国方言，或讲何种外国语言，一看到中国字，特别是中国的姓，就会产生一种无形的亲切感和认同感。两晋南北朝是汉族第二次大融合时期，西晋末，匈奴、羯、氐、羌、鲜卑的“五胡乱华”，在北方先后建立了十六国。南北朝时，北方几乎为鲜卑族所统治，北魏孝文帝下令全部鲜卑族所统领的各姓部落一律改称汉姓，北方地区的汉族一下子就融入了大量的外族成员。除此之外加入的民族还有北方的高丽、扶余、乌丸、柔然，西域的昭武九姓、龟兹、于阗、疏勒、车师、吐火罗、破落那，西南的天竺、叟，南方的巴、賨、獠、狸、蛮、溪、濮等族。这一时期，主要的变化是北方地区的中原汉族大量南迁江南地区，成为当地的大姓，当代中国南方著名大姓陈、林、黄等姓就是在这一时期南迁的。北方地区涌入了大量的鲜卑等族人，与当地汉人混居，形成新的华北地区的汉族和产生了一批新的汉姓。汉族第三次大融合时期是在唐宋，唐朝推行的是民族平等政策，外族在朝中可以担任要职，外族与汉族通婚十分普遍，从而加速了外族汉化的速度。这个时期融入的外族有：北方的铁勒、突厥、回纥、薛延陀、黠戛斯，西部的吐蕃、吐谷浑、羌、西域诸国，东北的高丽、百济、新罗、渤海、靺鞨、沃沮、契丹、奚、霫、鲜卑，南方的安南、占城、南蛮、乌蛮、白蛮等族。这一时期，中原百姓几次南下大迁移，聚集于赣浙苏，开发了闽粤地区，形成了著名的汉族一个分支——客家人。中国的人口重心开始由北方向南移动，到北宋后期重心已经越过长江进入南方。从此以后，汉族姓氏在南方得到飞速的发展，形成了许多著名的大姓望族。元人从贝加尔湖附近的蒙古东部兴起，蒙古骑兵六次南下，最终灭了南宋，成为中华大地的统治者，建立了元朝，这是汉族第一次被外族排除在统治地位之外。以蒙古贵族为主的元朝政权残酷地奴役剥削着汉人，汉族遭到了自炎黄以来从未有过的虐待和屠杀，人口急剧地减少。这是野蛮欺压文明，落后统治先进，愚昧颠倒了真理的反历史的大气候时期。南宋宁宗时全国人口（包括北方地区）已达1亿，而元朝初期的全国人口仅剩5500余万，汉人几乎死亡一半。后来元朝统治者逐渐恢复生产，人口逐渐地增加，到元顺帝时为元朝的人口顶峰时期，中国人（包括国土内的蒙古族等其他民族）的人口才达到8700万（赵文林和谢淑君《中国人口史》，1988年）。当时汉族的张、王、李、赵、刘五大姓约占全国人口的四分之一，有人曾一再向元顺帝建议杀灭汉人五大姓，有利于元朝蒙古贵族的统治，幸亏元顺帝没有允准，汉族最终逃过了一次灭族的大劫难（巫声惠《中华姓氏大典》，2000年）。元末天下再一次大乱，群雄起义，朱元璋统一了全国，建立了大明皇朝，在不到100年的时间内，中国的政权再一次回到了汉族人的手中。明初的人口再一次急剧减少到6000万，汉姓的数目达到2000个左右。中国姓氏在这次大的洗劫中又得到了一次大变革，吸纳了来自西亚的阿拉伯人、波斯人、突厥人、钦察人、康里人、畏吾人等新鲜血液，同时，蒙古人把西夏、高丽、契丹、女真、蒙古、吐蕃、安南、大理等外族人分散到全国各地，与汉人杂居，最后大部分外国人和外族融入到汉族之中，这是汉民族的第四次大融合。清朝是汉族第五次大融合时期。清朝虽然再一次把汉族排除出统治地位，但很快采取民族和睦政策，发展农业，人们能够安居乐业。在其长达268年的统治时期，只有太平天国起义是一次大的全国性的战争，除此之外，所有的战争皆为局部的，规模有限的。在这一时期，比历史上任何一个朝代中所发生的战争的程度要小，危害也小。全国人口从清初的8000多万，到清道光年间人口达到4亿，这是清朝人口发展的一大特点。清朝期间，北方地区的满、蒙以及东北地区的其他满洲八旗、蒙古八旗纷纷改用汉姓，西部和西南地区的少数民族也在清政府的“改土归流”的政策之下，纷纷采用汉姓，各地汉化的速度加快，中国姓氏再一次获得了扩充，姓氏数目达到2800余种。 1911年的辛亥革命推翻了清朝，成立了推行五族共和的民族团结的中华民国政府，汉族和其他民族一起正式称为“中华民族”。1949年成立了中华人民共和国，在中国国土上的56个民族，各族之间平等友好相处，互相自由通婚。汉字是全国的通用文字，55个少数民族都有人使用汉姓。目前正在使用的汉姓有3500个左右。中国同姓人群的迁移和融合的历史有力地证明：汉民族同化异族的能力是不能低估的，汉文化所起到的中华民族凝聚力的作用也是不可低估的。
1.3姓氏传递的延续性和稳定性中国人一般都习惯继承父亲的姓，以父系方式把姓氏传递给下一代。女子在一生内仅仅保留其父亲的姓氏，不传递给下一代。因此，绝大多数的姓氏属于一种无性别之分、以父系方式传递的“基因”，相当于位于代表人类男性染色体上的特殊遗传基因。可以这样假设，不管是X精子还是Y精子，均携有姓氏基因，均在第一代显示其姓氏的功能，惟有Y精子具有连续传递姓氏特征的性能，而X精子仅仅在第一代显示姓氏的特征而不能再传递。当然，我们也注意到在中国人中一直普遍存在着改姓的现象，这包括入赘婚姻、随母姓氏、避难改姓等情况，但是在全体中国人中改姓的人数是很少的，在人群中所占的比例也很低，并不影响原有姓氏在人群中的分布。而且，不管是在什么情况下改的姓，通常从第二代起仍以父系方式传递。这种改姓现象称为姓氏的突变，突变后的姓氏仍具有正常的父系遗传的功能。中国人姓氏的悠久历史和相对稳定的传递，以及具有中国社会进化特色的改姓现象，不但增加了中国人姓氏的多样性，而且也证明了中国的任何一个大姓的组成不会是单一的，这为追踪和寻觅各个姓氏的始祖和形成的年代提供了丰富的历史依据。所以，中国人姓氏是一种含有人类父系社会全部进化信息的、赋有相对稳定传递性质的、具有中国特色的资源。本节用自然科学的分析方法说明中国人姓氏的传递稳定性，所用的宋朝、元朝、明朝和当代的姓氏数据均来自作者的实验室，详细的样本抽样情况在以下章节中介绍。图1.3（见彩图）是宋、元、明、今四个时期的100个常见姓氏的分布曲线，中国人姓氏的分布散点存在一条符合公式Y=0.185ln(X+1）/X）（公式1.3）的分布曲线，（袁义达等，2000年b）其相关系数r为0.99,四条分布曲线互相吻合十分一致。说明中国人姓氏在这1000年中传递的连续性和稳定性。公式中：X代表大姓按人口多少排列的次序，即1,2,3……99,100正整数，ln表示取自然对数，Y代表在总人口中排在第X位的姓氏所占人口的期望值，用百分比表示。图1.3（见彩图）中的Y轴上的值为各时期的姓氏在人群中的分布比率。常见姓氏在不同时期的排列次序存在一定程度上的变化，次序排列的先后不是主要的，但其在人群中的分布比率值是重要的。中国人姓氏的变化主要发生在占人口1％以上的19个最常见姓氏之中，三个时期的19个最常见姓氏的合计人口均占了当时全国总人口的50％以上。这19个常见姓氏是：宋朝的王、李、张、赵、刘、陈、杨、吴、黄、朱、孙、郭、胡、吕、高、宋、徐、程、林等，约占了全国人口的54％；元朝的王、张、李、刘、陈、赵、吴、杨、黄、周、徐、朱、郑、胡、高、郭、林、程、马等，约占了全国人口的49％；明朝的王、张、李、陈、刘、杨、吴、黄、周、徐、朱、赵、胡、孙、郑、何、郭、沈、高等，约占了全国人口的51％；当代的李、王、张、刘、陈、杨、赵、黄、周、吴、徐、孙、胡、朱、高、林、何、郭、马等，约占了全国人口的56％。最明显的变化是在最常见的7大姓氏之中，见箭头A所指的。元朝和明朝的7大姓氏的占人口的比率比宋朝和当代均低1％以上。反映了元明时期中国人口曾经大幅度降低过。历史上人口数据表明，由于连年战争和屠杀，元朝的北方和四川地区的人口急剧减少了，而浙江、江西、湖南和湖北一带的人口却相对有所增加。从姓氏分布上也反映了这一现象，北方地区的主要姓氏王、李、张、刘和杨的总比率，元朝和明朝时期的五大姓的人口均比宋朝和当代的都低1个百分点以上，尤其赵姓的比率降低了3-4个百分点，赵姓为宋朝的皇室之姓，在元朝自然受到更大的冲击。而东南地区的第一大姓陈姓的比率反而比宋朝高0.7％，与当代的比率接近，成为元朝的第五大姓和明朝的第四大姓。明朝与当代之间的清朝，政局比较稳定，经济发展，玉米和红薯等高产作物广泛种植，人口增加迅速，尤其促使了北方地区人口的增加和部分“南方人口”的北归。至清末民初，全国人口已达4亿，南北人口比重趋于均衡。因此大姓人口迅速增加，以至恢复或超过了宋朝时期的相应姓氏的比率。宋朝、元朝、明朝和当代四个历史时期的姓氏分布反映了一个重要的现象：中国人姓氏在历史上传递是连续和稳定的。它说明了在历史的进程中，中国人姓氏所表现的血缘文化的痕迹与生命遗传物质，尤其代表男性的Y染色体的进化具有基本相同的和平行的表现。
1.4同姓率和同姓人群姓氏群体遗传学的目的，是研究姓氏群体中姓氏种类组成的变化机制。因此，首先面临的问题是如何表达群体的姓氏组成，并使其形成具有既可分析的、又可与真正的遗传基因进行比较的形式。比如，提到河南地区的姓氏群体组成，就是一个很笼统的概念，这样既不能与别的进行比较，又无法进行分析。在一个群体中包含了许多种的姓氏，因此，需要弄清这些不同姓氏在群体中所占的比重或称比例、比率、频率、百分比等，然后综合地考虑整个群体的姓氏组成。研究姓氏群体遗传的首要的概念是同姓率，在一个群体内随机相遇的两个人都姓同一个姓氏的概率称为同姓率。群体内部和群体之间的同姓率，是分析群体的遗传结构、近亲系数和群体间遗传距离的重要参数。计算同姓率的公式为（Crow,etal.1965）：公式中Ipq代表p群体和q群体之间的同姓率，pi和qi分别代表p和q群体的第i个姓氏在各自群体中的所占人口的比率，k表示两个群体总共拥有的姓氏数目，∑piqi表示pi和qi乘积的全部和。中国人不同历史时期的同姓率分别为：宋朝0.0264，元朝0.0203，明朝0.0213，当代0.0276。图1.4（见彩图）表示四个历史时期的100个常见姓氏分布累计值（图中位于下方曲线），以及累计同姓率比值（图中位于上方曲线）。有关四个时期的100个常见姓氏分布的详细情况见第二章。图1.4首先反映了四个历史时期的常见姓氏分布累计值和累计同姓率比值的曲线吻合一致。其中占人口1％以上的19个最常见姓氏累计人口在不同历史时期，分别为：宋朝占53.7％，元朝占49.5％，明朝占50.7％，当代占55.6％；其累计同姓率比值已分别达到宋朝93.4％，元朝90.3％，明朝91.4％，当代94.4％。而100个常见姓氏的累计人口分别为：宋朝占86.2％，元朝占84.3％，明朝占85.1％，当代占87.2％；其累计同姓率比值已分别快速达到宋朝99.6％，元朝99.3％，明朝99.4％，当代99.7％。说明大约85％的中国人集中于100个常见姓氏内，100个常见姓氏仅仅占中国总姓氏数不足5％，而随机同姓率的比值已高达99％。这就是说：在大街上随便找两个同姓的人，在100次中，有99次出现的姓氏必定属于100个常见姓氏，最多只有一次为其他的姓氏。所以中国常见姓氏人口的分布是研究中国人遗传结构和进化以及地域人群间的亲缘关系的主要因素。但是，我们也注意到绝大多数姓氏的人口相对很少，但往往显示出相对隔离的地域人群的特点。因此，常见姓氏和非常见姓氏的同姓群体分布具有各自的特点和含义。中国人历来有同姓聚居和联宗修谱的习俗，而且婚姻半径较小，婚娶地域相对固定，这样易形成同姓人群的分布。中国人姓氏的分布实际上主要反映了同姓人群的分布规律。这又反映了另一个重要的现象：中国人的姓氏或同姓人群存在两种状态，大姓和小姓，或称为常见姓氏和非常见姓氏。仅占总姓氏量不足5％的100个常见姓氏已集中了85％以上的人口，而占总姓氏量95％以上的3000多个非常见姓氏仅代表不足15％的人口。 100个常见姓氏的分布是反映各地人群的遗传组成的主要因素，它们决定着中国历史上人口迁移和地域人群间的亲缘关系的程度。而非常见姓氏人群更表现其地域特色和相对隔离的现象，保存着中华民族祖先遗传下来的各种各样的遗传资源，这是中华民族目前所拥有的最精华的民族遗产。我国是世界上人口第一的大国，拥有世界上最丰富的疾病人群资源，这包括疾病群体、家系和个体。家系就是同姓人群，特别是稀有姓氏的人群，稀有姓氏往往是单一祖先的传递。由于我国疾病谱与国外人群的疾病谱在群体遗传学上存在着差异，并占有遗传资源上的优势，特别是中国几千年姓氏制度所造成的世界上独一无二的同姓人群分布的特点，许多外国研究机构，特别是美国和日本，都想进入我国这一研究领域，获取宝贵的家系（同姓人群）和少数民族血液资源。所以，目前科技界一直在强调保护中国境内的生物多样性，保护中华民族基因组的资源，其原委和深远的战略意义就在于此。
1.5姓氏遗传的南北差异当代拥有近12亿人口的汉族，是世界上最大的族群。汉族在其形成的漫长历史中，向四处不断的迁移，与周边民族的交往，外族基因不断地流入，不同地区文化的互动，地理环境的影响和隔离，方言林立且差异悬殊，经济发展的不均衡，形成了许多各具社会文化特色的汉族亚群体。我国汉族的亚群体确确实实是存在的，但从来没有一个统一的划分依据和标准，而是各学科根据各自的需要制定自己的标准来划分的。官方的划分中，最著名的为语言学的划分，语言学家根据方言，把汉族分为北方、湘、赣、吴、闽、粤和客家七大方言区人群，每一方言区再被细分若干亚方言区。而其他学科因没有相应的标准，往往以长江为界，把汉族简单地分为南方人和北方人。更多的情况下，以省（区、直辖市）行政区划为单位来区分汉族亚群体，如河南人、山东人、上海人等。也有以大行政区划为单位结合人类文化学的特征来区分汉族亚群体，如华北人、华南人等。民间存在着不正规的划分现象，主要表现以家谱或几姓联谱的形式存在，这在我国的东南和南方地区、港澳台地区和海外华侨中十分盛行。民间的家谱类的传统资料是研究中国汉族亚群体的重要材料，以美国犹他州国际家谱研究中心为代表的一批国际研究机构，长期以来一直十分重视收集中国人的家谱，一直结合各种学科的需要，研究着中国人家谱的历史、今天和将来。我国国家图书馆和上海图书馆等收藏了中国年代最古、质量最高的家谱，全国图书馆收藏的家谱种类达2万多种，总数大约有20万册，这还不包括民间收藏的和1949年以后重修和新修的家谱。这是一笔巨大的财富和具有持续研究价值的宝贵资源。华夏民族在迁移和进化的过程中，北方地区主要交往和融合的是北方地区的少数民族，如匈奴、鲜卑、突厥、羌、蒙古等属北蒙古人种的民族；两广、闽、台地区主要交往和融合的是南方地区的少数民族，如南越、交趾等属南蒙古人种的民族。北方地理地形平坦，人群迁移容易，人群间的同化和语言统一要比南方地区快；南方丘陵起伏，地形复杂，气候恶劣，人群迁移困难，人群间的同化时间长，互相交往困难，造成地理上的隔离状态，语言变化很大，形成无数的“族群岛”。近12亿人口的汉族，分布于全国各地，虽同为汉族，南北之间方言杂乱，几乎到不能通话的地步；几千年的汉族进化历史也证明了南北地区的汉族存在差异，而且是一种群体遗传基因进化上的差异。因为文化上的差异，包括语言上的差异，政府通过政策法令，可以在不长的时间改变或缩小这类差异，这类差异不是根本性的；几千年的不同程度的隔离和遗传基因进化中所造成的不同地区汉族亚群体之间的差异才是本质上的区别。图1.5a（见彩图）是我们利用中国汉族全国各省的ABO,MN,Rh,P四个遗传基因的100多万个人的数据，用主成分分析法所作地域人群血缘亲缘关系图（Yuan Yida,et al.1992）。这幅示意图非常清晰地说明了：南北汉族之间存在着遗传结构上的差异。南方汉族所代表的省份包括闽、台、粤、桂四省区，长江流域地区的省份为中间地区，但中间地区的汉族的遗传结构更接近于北方地区省份的汉族，而浙江省的汉族的遗传结构倾向于南方。坐标系中，横坐标代表第一主成分（含42％的信息），纵坐标代表第二主成分（含17％的信息），详细的方法请参看有关的文献。中国汉族姓氏在历史上的传递是连续和稳定的，在历史的进程中所展现的血缘文化的痕迹与生命遗传物质，特别是代表男性的Y染色体的遗传具有基本相同和平行的表现。因此，用群体遗传学的分析方法可以分析汉族姓氏。我们对各省姓氏分布的数据进行生物遗传距离的分析，获得了宋朝、明朝和当代的汉族人群的三张聚类图，分别为图1.5b、图1.5c、图1.5d。并发现汉族从宋朝开始已经形成了南北两大群体（袁义达等，1999年）。图1.5b十分明显地把宋朝16个省划分为两大区域：南部的广东和福建与北部的14个省。这两区域间的遗传距离十分大，说明了南北两大人群的异源性，其地理分界线应在中国南部福建省与江西省交界的武夷山和广东省与湖南省交界的南岭一带。北部14个省又明显的划分为两块，其中浙江、江苏、江西和安徽四省形成了东南地区人群，其聚类的顺序也很合理，反映了古吴越民族与中原地区南下人群混合的历史痕迹。剩下的10省进一步可划分成两块，其中湖南和广西二省组合在一起，在宋朝时该地区是一块很荒凉的“蛮”地，其余的8个省包括了全部北方省份和西南省份，其特点是，北方省区和西北省区的人群之间的姓氏遗传距离都较小，反映了该地区人群经历了长期频繁的迁移、混居和融合，形成了互相依存的北方人群。而西南省份的人群在历史上一直主要与北方省份的人群进行交流，四川地区（包括贵州和云南）的聚类位置也反映了这一历史。湖北是一个十分特殊的省份，它处于长江的中游，北面河南和陕西，西接四川，东临安徽和江西，南靠湖南，是中国历史上兵家必争之地，图1.5b也十分有趣地反映了湖北的地理位置和历史。总而言之，宋朝姓氏频率分布的聚类图（图1.5b）反映了在1000年前，中国人群已经形成了南北二大人群，其基本的人群分布区域与现代的分布基本一致。图1.5c非常清楚地把明朝中国人分为南北两大人群，形成福建、广东和广西三省为南方人群，其他14省为北方人群的局面。明朝的人群地理分布特征已与当代的分布基本一致，其南北两大异源汉族的地域分界线也应在武夷山和南岭一带，而不是在长江。与宋朝的地域人群分布相比较，广西已与湖南分离而与广东、福建聚类。长江中上游的江西、湖南、湖北和四川形成了一块更接近于北方的区域，而江苏、浙江和安徽形成长江下游区域，但仍与南方人群血缘较远，更接近北方人群。图1.5d反映了当代中国汉族的南北两大人群的异源性，以及明显的分界地域在南部的武夷山和南岭一带。29个省市区分为南北两大块，而且其遗传距离很大，在图上用虚点表示。南方汉族包括福建、台湾、广东、广西三省一区（包括海南省、香港、澳门）。北方地区的东北三省、内蒙古和河北、北京和天津、以及山东和河南之间的遗传距离很近，都聚集在一起。随后，西北地区的陕西、甘肃、宁夏、山西、新疆聚在一起。安徽的姓氏分布表明其属于北方，但又接近长江流域的省份，所以安徽最后与北方的省份聚类。长江中上游的省份湖北、四川、湖南、贵州、江西、云南先后聚类在一起，形成一个亚群体，然后与北方的人群聚类，这是十分合理的。东部的浙江、江苏、上海聚类在一起，与南方的群体有一定的渊源，但几千年的进化使这一地区的人群更接近北方，所以最终与北方地区聚类。青海最后与北方聚类在一起，而不是先与陕甘宁聚类，这可能与青海的姓氏样本有关，青海的抽样点为西宁，西宁为解放后东部移民大西北的主要地区，所得到的样本可能为原先的上海和江苏地区的移民。总而言之，宋、明、今三个时期的姓氏遗传距离分析结果表明，在中国1000年前的宋朝已经形成了南北两大区域的人群，从姓氏遗传信息上明显地显示出南北两大区域人群结构的区别，表明南北两大区域人群的不同源性，其明显的地域分界线在南方的武夷山和南岭，而不是长江。中国人姓氏的历史至少已有4000年以上，主要起源于中国西北和中原地区的民族，融合并同化了各个时期周边各民族的姓氏，形成了中国几千年来一直在使用的汉字姓氏。根据1000年来的中国人姓氏分布和对人群迁移、混居和融合情况的分析，基本上反映了当时的民族联合和进化的历史，也说明了中原地区的人群是组成中华民族的主体，它融合了南北各个时期的民族成分，尤其是北方地区的民族成分，形成了互相依存不可分割的当代的中华民族的整体。当代人群分布的情况基本上与明朝、宋朝人群分布具有很高相似性和渐变的过程，它们之间的区别点正是反映了这1000年期间人群进一步迁移与分化的结果。
1.6 姓氏数量的一般估计群体遗传学定义：在同一群体中存在两种以上不同遗传类型的个体的现象，称为遗传多态现象，也称遗传多样性。中国人姓氏具有高度多样性。我们已经讨论了中国人姓氏分布的规律和稳定性，中国人85％集中于100个大姓中，而小姓更具备隔离群的特征，突出其地域性和独特的遗传个性。人群中的有条件的改姓（突变）和随意的改姓（自然选择）仅仅能改变人群中的姓氏数目，但对人群中主要姓氏的分布影响不大，但人群的迁移是造成群体内各姓氏比例变化的主要因素，历史上决定人群迁移和改变人群内姓氏组成比例的是常见姓氏。所以，研究中国人姓氏，除一定要了解中国人姓氏的起源和演变外，还要了解中国人历史上产生过多少姓氏？每一时代实际使用多少姓氏？保证每一时代姓氏数量的平衡是否有规律？姓氏群体遗传学将探索这类问题。中国人有过多少姓氏？从来没有人统计过，也无法得到比较确切的数据。汉朝史游《急就篇》列130个姓；唐朝林宝《元和姓纂》收录1232个姓；流传最广的宋朝“百家姓”收录442个姓，宋朝邵思《姓解》收录2568个姓，郑樵《通志·氏族略》收录2255个姓；元朝马端临《文献通考》收录3736个姓；明朝陈士元《姓觽》收录3625个姓，王圻《续文献通考》收录4657个姓；近代邓献鲸《中国姓氏集》收录5652个姓，王素存《中华姓府》收录7720个，以上所有的姓氏专著所收的姓氏中均包括当时已经不存在的古姓，以及当时部分少数民族的汉字姓。20世纪90年代出版的袁义达《中华姓氏大辞典》收录中国古今姓氏11969个，同时还收录异译、异体字姓氏3136个，这是至今收录中国人姓氏最多的一部姓氏专著。但是，到底中国5000年来出现过多少姓氏？仍然无法作出准确无误的回答。但有一点可以肯定，中国人5000年来可以收录到的汉族和少数民族的姓氏的总数远远不止12000多个。目前，我们继续在收集和整理中国人姓氏，至今为止收录到的中国人古今姓氏已经超过了22000个。当代正在使用的中国汉姓有多少？这是大家所关心的，也是可以统计的。我们曾经从人口普查抽样资料结合其他途径作过粗略的统计，汉族目前正在使用的姓氏大约有3100个左右。要得到比较确切的数字，那只有在全国人口普查中增加了姓氏统计的项目后，或者利用目前公安部全国户籍卡上的姓氏登记资料才有可能。姓氏数目和同姓人群的分布是中国的一种特殊的国情资源，应予以重视。从理论上讲，在一个隔离群体内，如不发生改姓的情况，姓氏种类是固定的。群体内部的姓氏种类和每种姓氏在群体中的比例，因群体迁移并与周围其他人群的交往和混合会发生变化，这类变化相应于生物遗传基因频率的变化，我们称为基因流动，所以，群体内部的姓氏种类发生了变化，也意味着外来姓氏的流入和群体中姓氏的流出的发生。我们根据1000年来不同时期汉族姓氏的分布、传递的规律、遗传稳定性，获得了估计中国近2000年来各个历史时期、各地区或省份内的姓氏种类的公式（袁义达等，2000年a），公式如下：＊表中的西汉初的人口数引自《中国人口史》（王育民，1995年），解放后的人口数引自《分省中国地图集》（2000年），其中第五次人口普查数来自国家统计局的公报（2001），其余年代的人口数引自《中国人口史》（赵文林、谢淑君，1988年）。公式中S代表姓氏种类，N代表人口数，υ代表人群内姓氏分布的综合分化程度，ln代表自然对数，想了解详细的内容参见有关文献。表1.6所列的各时期的姓氏种类，即姓氏估计数，就是依据上公式推算的。决定姓氏数目多少的最主要因素是人群的分化程度，即与周边人群交往和融合的程度，υ就是代表人群内部姓氏分布的综合分化程度的参数，同时也表示人群迁移率的相关参数（参看第二章）；其次决定姓氏数目多少的因素是人群的实际人数（N）。汉族姓氏在西汉初大约有1800个，一直到唐朝末的1000年中，汉族姓氏的数目增加有限，仅仅增加了10％。到了明朝末，汉族姓氏首次突破2500种，到清朝道光年间汉姓已经发展到3000种以上。当代汉族的姓氏估计有3500种左右，而且还在增加之中。
第二章姓氏分布 2.1 姓氏分布的群体原理姓氏作为生物学的一种标记，尤其作为人类遗传标记，已有120多年的历史了，比人类第一个遗传标记ABO血型系统发现还要早25年。1875年进化论的奠基人达尔文的儿子乔治·达尔文首次提出了姓氏是一种生物学标记，并用英国人的姓氏资料证明了姓氏与人类的遗传特征之间的平行关系（Darwin,1875）。20世纪80年代以前，在自然科学领域，姓氏主要应用于鉴别种族和近亲结婚的研究上。1982年，在美国俄勒冈州尤金，先后召开了两次世界性“姓氏在生物科学中”的专题研讨会，姓氏的研究被推向了一个新高潮（Human Biology,1983）。20世纪80年代以后，特别是通过与人类群体中的遗传多样性分布的比较，在群体间的亲缘关系和人群迁移等人类群体遗传学研究领域中，姓氏作出了较好的贡献。几千年以来，中国人一般是以父传子的方式代代相传其姓，子和女均继承父亲的姓，女子在一生中仅保留其父系的姓，不传递给下一代，同时，结婚出嫁之后仍保留着自己的姓。因此，绝大多数的姓氏属于一种无性别之分、以父系方式传递的“基因”，相当于人类性染色体遗传的特殊基因。在世代传递过程中，姓氏不受疾病、气候、居住的地区和环境的影响，具有中性的性质。假设，决定男性性别的Y染色体上有一个“姓氏”基因，那么，每一种姓氏相当于这个“姓氏基因”上的一个中性等位基因（Zei,et al.1983a）。中国目前正在使用的汉字姓氏大约有3500个，也就是说中国人Y染色体上的“姓氏基因”含有3500多种等位基因。当然，我们也注意到在中国人中一直普遍存在着改姓的现象，包括过继改姓、随母姓氏、避难易姓、少数民族用汉族姓氏等等。但是，在整个中国人中出现改姓的人很少，比例很低，很大一部分在第二代时又恢复回原来的姓氏。在多数情况下，改姓往往选择已有的大姓和当地的著名姓氏。因此，改姓不会严重地影响群体内姓氏的分布。而且，不管在何种情况之下改的姓，从第二代起，仍以父系方式传递。改姓的现象相当于遗传学中的等位基因突变，我们称为“姓氏突变”，突变后的姓氏仍具有正常的父系遗传的功能。这种具有中国社会进化特色的改姓现象，不但增加了中国人姓氏的多样性，而且增加了为追踪各个姓氏的始祖和年代的新机会。
卡林－麦格雷戈的“中性等位基因分布的理论”可以分析姓氏在群体中分布的特征（Karlin and McGregor,1967）。姓氏在“中性等位基因分布的理论”中表现出这样的一种特征：在一个与外界隔离的群体内，姓氏的种类数、每种姓氏在群体中的比例（或称频率）是世代不变的。因群体迁移并与周围其他人群交往和融合，而发生了群体内姓氏种类的变化，增加或减少；同时每种姓氏在群体中的比例（或称频率）也发生了改变。这类变化相当于遗传基因频率的变化，遗传学称为基因流动。群体内姓氏频率发生了变化，因此，也称群体与周边的群体之间发生了“姓氏基因”的流动。研究群体内或群体间的姓氏种类组成和姓氏频率变化的学科，就是姓氏群体遗传学。通过对群体内部或者群体之间的姓氏种类和姓氏频率的研究，可以清楚地知道群体内的姓氏种类的组成和各种姓氏分布的情况，这就是群体的“姓氏遗传”结构的内容；通过与其他群体的“姓氏遗传”结构的比较，可以探讨群体之间的亲缘关系的远近；通过对不同时代的不同地区的姓氏种类和姓氏频率分布的研究，可以了解“姓氏基因”在历史上变化的规律，可以探讨群体之间或者地区之间“姓氏基因”的流动；通过用数字化和数理模型来分析姓氏种类和姓氏分布频率的变化，可以说明群体间所发生的迁移、交往和融合的定性的和定量的变化；把姓氏种类和姓氏频率的变化标定在地图上，我们可以得到一系列的有关同姓人群的分布图谱。联系到人类Y染色体相对隔离群体的分布，同姓人群的分布图谱对探索同姓群体与遗传疾病有关的研究，对高发人群的分布规律有关的研究均有可能提供有价值的线索。
有一组相关的计算公式（Zei,et al.1983b;Piazza et al.1987）可以用于对“姓氏基因”经流动后，群体内姓氏种类变化的研究：在以上公式中，N表示人群的样本大小，S表示人群中的姓氏种类数，a表示群体内姓氏种类丰度（丰富的程度）的相关参数，υ表示人群迁移率的相关参数，Se表示拥有k个人的姓氏的种类的数期望值。Inv表示是对v值取自然对数。a和υ是分析姓氏频率分布的两个重要参数。从同一个群体中或者同一个省区内，随机获得的不同样本的a值是一个常数，与样本N的大小不存在函数关系，但与姓氏种类数S的大小有函数关系，姓氏种类越丰富，a值越大。在研究中，a和v的计算比较复杂，往往先求S/N的比值后，再求υ值，最后求a值。表2.1根据姓氏种类S与群体大小N的比值，利用S/N＝（υ／（υ－1））lnυ的公式，用计算机计算获得的标准υ值。S/N的比值一旦确定，表示人群迁移率的相关参数υ值亦确定，υ值是常数。υ值的大小直接反映群体在某一时期的迁移的程度，υ值与样本N的大小存在高度的负函数关系。所以，对于获得的姓氏资料在进行分析之前，首先要进行“中性等位基因分布”的检验，如果这组姓氏资料的分布符合“中性等位基因分布”的理论，那么随后的研究才有价值。我们在下一节将对宋、元、明三朝以及当代的姓氏分布作“中性等位基因分布”的检验。图2.1（见彩图）中横坐标代表样本大小N值，纵坐标代表人群迁移率的相关参数υ值。横、纵坐标均为对数坐标。短横线、三角形、圆点和菱形分别代表宋朝、元朝、明朝和当代的υ值，总相关系数r为0.99，存在υ＝20N-0.89幂函数的关系（袁义达，2000年a）。
2.2 姓氏分布的检验宋朝以前可以进行统计的姓氏资料十分稀少，目前还没有可利用的合适材料。宋朝、元朝、明朝和当代的姓氏资料比较丰富，但是，从近千部历史文献中收集到的这些资料是否能代表当时的情况？统计结果的可信程度如何？解决它对我们来说是一件十分重要的工作。在1875年，伟大的进化论之父达尔文之子、英国著名的天文学家和数学家乔治·达尔文是世界上最早用统计的方法对姓氏进行科学的研究（Darwin,1875）。近代最为著名的是美国科学家克罗，1965年他首次提出同姓率（Isonimy）的概念和姓氏含有群体遗传结构的信息（Crow,1965）。当今世界最负盛名的美国斯坦福大学的人类群体遗传学家卡瓦利－斯福扎是第一位研究中国人姓氏分布的科学家，他在1983年研究了台湾地区的姓氏分布，随后与大陆科学家合作开创了中国人姓氏群体遗传学的研究（YuanYida,etal.1993）。目前，有关姓氏频率研究的方法已经十分成熟，尤其在1983年以后，英、美等国著名的《自然（Nature）》、《人类生物学（HumanBiology）》等杂志刊登了几十篇有关各国的姓氏频率研究的论文和方法。中国人姓氏有三大特征：首先是历史悠久，中华民族的历史就是5000年来华夏民族和汉民族与周边民族融合和同化的过程，这个过程一直是以华夏民族和汉民族的传统文化为主导的，中国人姓氏一直伴随着这一过程，姓氏是以一种血缘文化的特殊形式记录了这一全过程。其次是传递稳定性，在没有特别的原因时，中国人的姓氏不会随便地改动。其三是分布不均衡，中国人历来有同姓聚居和修谱联宗的习俗，婚姻半径小，婚娶地域相对固定，中国人在历史迁移的过程中，已经形成了许多大小不等的同姓人群，在各地的分布是不均衡的。因此，我们对所获得的姓氏资料的首要条件是要求随机性，这样才能全面客观地反映全国姓氏分布的情况。我们所用的宋、元、明和当代的姓氏资料均为随机样本，数量大（详细的内容见本章的随后几节）。随机样本的姓氏分布是否符合“中性等位基因分布”的检验是进一步分析的必要条件。随机样本中的各种姓氏的分布频率，称为观察值。利用上节（2.1）中的四个公式计算得到各种姓氏的理论分布频率，称为期望值。观察值和期望值之间的吻合程度是检验随机样本可利用价值的标准，一般用数理统计学中的统计量x2值来衡量。图2.2是明朝山西地区的姓氏分布的检验图，图中浅色的柱代表样本观察值，深色的柱代表估计的期望值。纵坐标标记的是各类姓氏数目占全体的百分比值，横坐标代表拥有k个人的姓氏的种类数。1，表示这组样本中1姓1个人的姓氏的数目是59个，占23％，而期望值是57.2个，占22.2％，这对数字的x2值是0.06;2，表示这组样本中1姓2个人的姓氏的数目是33个，占12.8％，而期望值是28.2个，占11％，这对数字的X2值是0.8;3，表示这组样本中l姓3个人的姓氏的数目是19个，占7.4％，而期望值是18.6个，占7.2％，这对数字的x2值是0.008；以下类推，表中列出20组的最后的组是1姓20人。明朝山西省的样本是4861人，姓氏数目257种，全部被划分为35组样本，35组的观察值和期望值之X2值的和为29.3，自由度（d.f.）为33，总x2值的概率P﹥0.65，统计学上认为这个样本与期望值是一致的，基本上可以反映当时山西省内姓氏分布的概况。同时，根据2.1的四个公式推算得到分析姓氏频率分布的两个重要参数a值和v值，分别为57.83和0.01176。我们对宋朝、元朝、明朝和当代四个时期的全国姓氏都按省为单位，进行了卡林－麦格雷戈的“中性等位基因分布的理论”的检验，所有的有关数据分别列于表2.2a、表2.2b、表2.2c和表2.2d。一般认为总X2值的概率在P﹤0.05时，观察值和期望值之间存在显著差异，说明样本的代表性不够，反映出与实际上的情况有较大的差距。氏宋朝各省姓氏分布的观察值和期望值的吻合程度显示：其中山西省和湖北省的x2值有显著差异，其余各省的姓氏分布吻合卡林－麦格雷戈理论的中性等位基因分布的模式。福建、浙江、江苏、江西、四川和河南六省的υ值均很低，都小于0.04。甘肃、山西、河北、湖北、湖南、广东和广西等7省的迁移的相关参数υ值均很高，表明在这些省区中人群的迁移十分频繁。在宋朝时期，河北、山西和甘肃等北方省区不属于赵宋皇朝的领土，而在唐朝时代汉人已经开始逐渐失去了对这些省区的控制。唐宋时期北部省区前后由西夏、辽国、金国和元蒙古等北方民族政权统治，西南和西北地区由吐蕃和回鹘等民族支配，这些地区一直受到战争的蹂躏，人群迁移十分频繁，外来民族与当地人群的混居也十分普遍。随着战争的间隙及战后的生产的恢复和人民的安居乐业，这些地区外来民族的汉化进程加快。从汉、晋、南北朝、隋唐以来，姓氏的汉化一直没有间断过（姚薇元《北朝胡姓考》，1958年；陈连庆《中国古代少数民族姓氏研究》，1993年），而且，姓氏的进化一直伴随着人群的融合和分化进程。在宋朝的320年间，湖北、湖南、广东和广西等省区的人口增长非常之快，其增长速度比东南省区还要快，这与人群迁移的相关系数υ值，以及表2.3a（此表在下一节）中1210年（南宋）和980年（北宋初期）之间的人口比率所反映的现象基本相符。湖北的人口比率值较低，而迁移的相关参数υ值又很高，这与湖北在宋朝320年中人口时而激增、时而锐减有关，说明人群迁入和迁出的频繁。由于北方民族的不断强大和南移，中原地区的大批居民向南部和东南省区迁移，到北宋末，中国人口比重在历史上第一次出现了南方大于北方的局面。宋朝是中国人口史上重要的时代，从此结束了我国北方人口多于南方的局面，政治重心和经济重心也开始由北方移向南方。元朝16个省中的四川、湖北、辽宁和河北的x2值出现显著的差异。其余各省的姓氏分布吻合卡林－麦格雷戈理论的中性等位基因分布的模式。明朝17个省区中的河北和河南两省的x2值有显著差异，其余所得出的结果均吻合中性等位基因分布的模式。a和υ值是研究群体内遗传结构的分化和人群迁移的两种主要的指标，a和υ是互相依存的函数关系。通过对各省的a值的分析，可以了解省内的姓氏分化程度，a值与省内的姓氏种类S和样本大小N成正比关系，a值大，样本数大，表明姓氏的种类S也多，说明群体内遗传结构组成的复杂和分化程度高。明朝时期的河北、河南、江苏、四川、山东、湖北等省姓氏分布的a值均比较大，姓氏的种类也多。而广西、贵州（包括云南）、广东、福建等省姓氏分布的a值均比较小，姓氏的种类也少。这与中国姓氏主要起源于黄河流域的中原地区并向四周扩散的历史，在与北方周边民族融合过程中吸收外源姓氏要大于与南方民族交流的史实都是一致的。 a值提示我们，以中国的省行政区划为单位的群体是一个不完全随机的婚配群体。其原因除了省地域广阔、地形复杂外，更重要的因素是中国人宗族观念较为浓厚，习惯于同姓或少数几姓聚居的习俗。中国农村地区的婚姻半径狭小、婚配地域相对固定，较易形成以一种姓氏或少数几种姓氏为中心的地域性人群，这种地域性人群可以认为具有男性遗传物质（Y染色体）相对隔离的人群。因此，从群体遗传学的角度认为：以中国的省行政区划为单位的群体确是一个不完全随机的婚配群体，是一个混合群体，但又有其分布的规律。所以，分析中国各地区内姓氏分布的种类和渊源，应是研究中国人群遗传组成和演变的重要的内容和有价值的参考线索。 υ值表示人群内姓氏分布的综合分化程度，包括群体内的姓氏改变（突变）和人口迁移。实际上群体内姓氏的改变是很少发生的，而人口迁移是经常发生的。因此，群体约小，人口的迁移越容易影响群体内的遗传组成的比例（这里指姓氏的分布），其υ值表现越大。υ值的大小直接反映了人群迁移的相对程度和样本群体的规模。影响υ值大小的最主要因素是群体样本的大小。当代29个省市区中新疆的x2值出现最显著的差异，说明新疆的样本不是随机的，有待对新疆地区重新进行姓氏的抽样。另外，河北、河南、江苏和黑龙江四省的x2值也出现显著的差异。其余各省的姓氏分布吻合卡林－麦格雷戈理论的中性等位基因分布的模式。新疆、青海、宁夏、北京、天津和上海等省市区的υ值都大，反映了人群迁移的程度高。台湾、福建、广东的a值均相对较小，均小于30，明显地反映了南方地区姓氏种类相对于北方要少。a值次小的省区有青海、广西、湖南、宁夏，均小于45。
2.3 宋朝姓氏的分布宋朝包括北宋和南宋，从公元960年赵匡胤在陈桥驿发动兵变，夺取了后周的政权，以开封为首都，建立了北宋王朝，到1279年南宋丞相陆秀夫负背九岁宋帝赵昺，在广东新会南的崖门投海自尽，宋朝灭亡，共319年。在这期间，北方地区先后存在辽、西夏、金和元政权，因此，宋朝的人口和汉族姓氏应包括当时的宋朝和北方四个政权统治下的人口和汉族姓氏。有学者统计了宋朝四个阶段的人口数（赵文林和谢淑君《中国人口史》，1988年）：980年大约3500万，1079年大约7900万，1102年大约8200万，1210年大约10800万。
这四个阶段的人口数包括了北方地区先后存在过的辽、西夏、金和元政权的人口数，根据这四个阶段的数据，以年为加权平均值的计算法，获得宋朝时期平均人口数为9300万。表2.3a列出了宋朝四次全国各省的人口数。为便于与明、元和当代的比较，行政区划一律按现代的行政区表示，其中河北省包括北京、天津，江苏省包括上海，四川省包括重庆，广东省包括海南。宋朝姓氏的统计样本来自于《宋人传记资料索引》（昌彼得等，1974年），此书从490种文献和许多其他的资料中收集了宋朝320年间的有关的人物，是迄今为止所发现的收集宋朝人物最全的一部文献。根据每一人物的姓名和籍贯，或者居住地、工作地区、文献表明的地点进行统计。为了便于与当代的姓氏研究的结果比较，宋朝地名的省份的归属按目前的行政区划进行归并。东北地区、台湾和西藏地区缺乏姓氏资料。在统计中，一些省份的资料由于太少，我们只好把它们与其相邻的省份合并，其中北京和天津的资料归于河北省，上海的资料归于江苏省，内蒙古和辽宁的数据合并到河北省，新疆、青海的数据合并到甘肃省，宁夏的数据合并到陕西省，云南和贵州的数据合并到四川省。总共得到23411个人物的数据，获得436个姓氏。严格地讲它并不是一个完全随机的样本。第一点，我们对各省的样本观察值和宋朝的人口统计数相比较，发现凡是经济发达的省份，尤其是东南地区数省，其样本数相对较大，而经济落后的边缘省区和宋朝与北方政权频繁交战的边界省份的样本数相对较少。在经济发达和社会稳定的省区，人民受教育的机会多，做官的人士和有成就的文化人士相应地也多，反之则少。这就是造成了在文献中各省区之间的样本数不符合随机平衡的主要原因。为了比较正确地了解宋朝时期全中国的姓氏分布的情况，我们依据宋朝四次人口的统计值（见表2.3a），以年份间隔为加权数计算宋朝的全国和各省平均人口数和比重（见表2.3a），从而推算出宋朝时期全国姓氏的期望分布频率。第二点，在这份资料中，河北省的赵姓数据过大，且97％的赵姓人物出自河北涿州。为何会出现河北省赵姓人数异常的情况呢？这与“皇族效应”有关，宋朝的开国皇帝赵匡胤，其籍贯和出身地均在河北涿州，因此涿州的赵姓人士很容易做官和出名，由此造成了赵姓人数在文献中的异常。在历史上，因“皇族效应”而造此表中宋朝历年的人口基本数据引自《中国人口史》（赵文林和谢淑君，1988年）成在文献中皇族姓氏的人数异常是非常明显的，如汉朝的刘姓、唐朝的李姓、明朝的朱姓等。为了获得更接近随机的数据，对河北涿州地区的赵姓数据作必要的推算，获得了合理的数据。表2.3b列出的是宋朝100个大姓的分布频率。宋朝和当代各100个大姓的分布频率十分一致。两个时期的100个大姓分别覆盖了总人口的86.17％和87.19％，其中占总人口1％以上的最常见的姓氏分别为18个和19个，这些最常见的姓氏分别代表了总人口的52.7％和55.6％。宋朝的七大姓氏为王、李、张、赵、刘、陈和杨，当代的七大姓氏为李、王、张、刘、陈、杨和赵，姓氏完全一样，但在人口数的排列上略有区别。宋朝和元朝、明朝和当代各100个大姓的分布频率曲线非常一致（见彩图1.3），说明了中国汉族姓氏的传递在这1000年间是十分稳定的。七大姓氏在全国的分布十分不均衡。全国第一大姓是王姓，在山西、山东、河北、江苏、安徽五省中为第一大姓，分别占省人口的比例为13％，12.7％,10.1％,5.8％和5.6％；在甘肃、湖北、四川、浙江、江西五省中为第二大姓，分别占省人口的比例为11.6％，9.1％,7.6％,6.1％和6％；在陕西和河南二省中为第三大姓，分别占省人口比例为9％和7.8％；在广东和湖南二省中为第五大姓，分别占省人口比例为4.5％和4.1％；在福建省仅为第八大姓，占省人口比例为3.5％；而广西的王姓仅仅排在第十二位，占省人口2.2％。王姓主要分布在长江以北的地区，从北向南其占人口的比例逐步地减少。李姓为宋朝第二大姓，在陕西、四川、湖南三省中为第一大姓，分别占省人口的比例为12.2％,7.8％,7％；在河北、广东、山西、河南、江苏五省中为第二大姓，分别占省人口的比例为10％,9.5％,8.4％，8.2％和5.5％；在甘肃、山东、湖北、广西、江西五省中为第三大姓，分别占省人口比例为10.2％,8.4％，8％，7％和5.6％；在福建、安徽、浙江中分别为第五、第六、第七位大姓，分别占省人口比例为4.5％,4.1％和2.5％。李姓的分布主要集中在西北和西南，向东部地区逐步地减少。张姓为宋朝第三大姓，在甘肃、湖北、河南三省中为第一大姓，分别占省人口的比例为12.3％,10.2％,8.4％；在山东和陕西二省中为第二大姓，分别占省人口的比例为10.2％和10.1％；在湖南、山西、江苏三省中为第三大姓，分别占省人口比例为6.4％,6.1％和5.5％；在河北、广西、安徽三省中为第四大姓，分别占省人口比例为6.8％,5.5％和5.1％；在四川省为第五大姓，占省人口比例为5.7％；在广东省为第七大姓，占省人口比例为3.4％；在浙江、江西和福建分别排在省中的第八、第九和第十位大姓，分别占省人口比例为2.5％,3％和2.7％。张姓的分布主要集中在北方，尤其在中原地区特别密集，然后向东南部地区梯度地减少。赵姓为宋朝第四大姓，在广西省中为第一大姓，占省人口的比例为8.8％；在湖南省中为第二大姓，占省人口的比例为6.8％；在河北、广东、浙江三省中为第三大姓，分别占省人口比例为9.6％,8.1％和5.2％；在甘肃、陕西、河南、四川、山东、湖北六省中为第四大姓，分别占省人口比例为9.2％,6.7％,6.7％,5.9％,5.9％和5.6％；在江西和江苏二省中为第六大姓，分别占省人口比例为3.7％和3.5％；在安徽省为第七大姓，占省人口比例为3.9％；在山西和福建分别排在省中的第八和第十一位大姓，分别占省人口比例为3.6％和2.4％。赵姓的分布比较分散，主要集中在河北、浙江和两广地区。刘姓为宋朝第五大姓，在江西省中为第一大姓，占省人口的比例为7.6％；在广西省中为第二大姓，占省人口的比例为7.1％；在湖南、广东、福建、浙江四省中为第四大姓，分别占省人口比例为6％，5％，4.7％和4.3％；在河北、山东、山西、江苏、河南五省中为第五大姓，分别占省人口比例为6.3％,5.6％,4.2％,4％和3.2％；在陕西省中为第六大姓，占省人口比例为4.2％；在湖北、甘肃、四川三省中为第七大姓，分别占省人口比例为3.5％,3.4％和2.7％；在安徽省排在第八位大姓，占省人口比例为3.5％。刘姓主要分布在中原和东南地区。陈姓为宋朝第六大姓，在福建、广东、浙江三省中为第一大姓，分别占省人口的比例为13.1％,9.7％和6.3％；在江西和江苏二省中为第四大姓，分别占省人口的比例为5.4％和4.8％；在湖北、湖南、四川和河南四省中为第六大姓，分别占省人口比例为3.8％,3.7％,3.7％和2.9％；在陕西省中为第十二位大姓，占省人口比例为1.5％；在安徽、山东二省中为第十三位大姓，分别占省人口比例为2％和1.5％；在河北、湖北、广西、山西分别为省中的第十五、十六、二十、三十位大姓，分别占省人口比例为1.4％,1.4％,1.1％和0.6％。陈姓主要分布在东南地区，向西北的方向逐步地减少。杨姓为宋朝第七大姓，在四川、山西、陕西、甘肃分别为省中的第三、第四、第五和第六大姓，分别占省人口的比例为6.4％,6.7％,5.7％和4.8％；在湖南和河南二省中为第八大姓，分别占省人口比例为2.9％和2.1％；在广西、河北和湖北三省中为第十大姓，分别占省人口比例为2.8％,2％和1.9％；在福建和浙江二省中为第十三大姓，分别占省人口比例为1.9％和1.8％；在安徽、江苏、山东、江西、广东分别排在省中的第十五、十七、十八、十九和二十位大姓，分别占省人口比例为1.8％,1.4％,1.1％，1.4％和1.1％。杨姓主要分布在西南和西北地区，逐渐向东南方向梯度地减少。在每个省份中也表现出某些地方性特点的高比例的姓氏。比如，江西的曾姓和胡姓；四川的苏姓和何姓；河南的韩姓和郭姓；山东的晁姓和孔姓；河北的曹姓和贾姓；浙江的吴姓和徐姓；福建的林姓、黄姓和郑姓；安徽的汪姓和程姓；湖南的谭姓和唐姓；陕西的宋姓、韩姓和高姓；山西的薛姓、郭姓、侯姓和折姓；江苏的朱姓和孙姓；湖北的吴姓；甘肃的郭姓、马姓和董姓；广东的黄姓和冯姓；广西的蒋姓、田姓和石姓。表2.3c列出了宋朝各省的排列在前10位的大姓。
2.4 元朝姓氏的分布元朝从1271年忽必烈建国号“元”起，至1368年，凡11帝，98年。元政权在灭宋之后，在元世祖至元二十七年（1290年）和元文宗至顺元年（1330年）进行过两次全国人口普查。《中国人口史》（赵文林和谢淑君，1988年）统计了元朝这两个阶段的人口数：1290年大约7500余万，1330年大约8700余万。根据这两个阶段的数据，以年为加权平均值的计算法，获得元朝时期平均人口数为8100余万。表2.4a列出了元朝两次全国各省的人口数。为便于与宋、明和当代的比较，行政区划一律按现代的行政区表示，直辖市一律不单独设立，其中河北省包括北京、天津；江苏省包括上海；四川省包括重庆；广东省包括海南。
元朝姓氏的统计样本来自于《元人传记资料索引》（王德毅等，1979-1983年），此书从130余种文献和许多其他的资料中收集了元朝的有关的人物，是迄今为止所发现的收集元朝人物最全的一部文献。根据每一人物的姓名和籍贯，或者居住地、工作地区、文献表明的地点进行统计。为了便于与当代的姓氏研究的结果比较，元朝地名的省份的归属也按目前的行政区划进行归并。黑龙江、吉林、台湾和西藏地区缺乏姓氏资料。在统计中，一些省份的数此表中元朝历年的人口基本数据引自《中国人口史》（赵文林和谢淑君，1988年）资料由于太少，我们只好把它们与其相邻的省份合并，其中北京和天津的资料归于河北省，上海的资料归于江苏省，内蒙古的数据合并到辽宁省，青海、甘肃和宁夏的数据合并到陕西省，云南和贵州的数据合并到四川省，广西的数据合并到广东省。总共得到14035个人物的数据，获得514个汉族姓氏。严格地讲，它并不是一个完全随机的样本。我们对各省的样本观察值和元朝的人口统计数相比较，发现凡是经济发达的省份，尤其是东南地区数省，其样本数相对较大，而经济落后的边缘省区的样本数相对较少。在经济发达和社会稳定的省区，人民受教育的机会多，做官的人士和有成就的文化人士相应地也多，反之则少。这就是造成了在文献中各省区之间的样本数不符合随机平衡的主要原因。为了比较正确地了解元朝时期全中国的姓氏分布的情况，我们依据元朝二次人口的统计值（见表2.4a），以年份间隔为加权数计算元朝的全国和各省平均人口数和比重（见表2.4a），从而推算出元朝时期全国姓氏的期望分布频率。表2.4b列出的是元朝100个大姓的分布频率。元朝和宋朝100个大姓的分布频率十分一致。两个时期的100个大姓分别覆盖了总人口的84.3％和86.17％，其中占总人口1％以上的最常见的姓氏均为18个，这些最常见的姓氏分别代表了总人口的48.5％和52.7％。元朝和宋朝占人口2％以上的最常见姓氏有九个，元朝的九大姓氏为王、张、李、刘、陈、赵、吴、杨、黄，宋朝的九大姓氏为王、李、张、赵、刘、陈、杨、吴和黄，九大姓氏完全一样，但在人口数的排列上略有区别。元朝和宋朝之间的最大区别主要是：元朝的北方姓氏占全国人口的比例都比宋朝的低，赵姓低2.5％、李姓低2.3％、王姓低1.5％、张姓低0.6％，王、张、李和赵主要分布于长江以北地区；而南方的姓氏都比宋朝的高，陈姓高0.7％、黄姓高0.6％；处于长江流域地区的大姓则比宋朝略有增长，吴姓略高0.5％、刘姓略高0.3％、杨姓略高0.2％。这种明显的变化反映了宋朝到元朝时期中国人口曾经大幅度降低过，特别表现在北方地区大姓人口锐减的迹象。北方地区连年战争，当地的百姓惨遭蹂躏和屠杀，中原人民多次背井离乡往南方迁移，到战争结束后有一部分又返回中原故土，北方地区的王、张、李、赵等大姓受到的冲击是最大的；东南地区相对的平稳，当地的大姓自然得到了保护。
2.5明朝姓氏的分布 1368年朱元璋称帝，史称明太祖，推翻了元朝的统治，建都南京。永乐十九年（1421年）成祖朱棣迁都北京。1644年李自成农民军攻破北京，明朝灭亡。共历17帝，277年。明朝期间先后有五次全国性的人口普查，《中国人口史》（赵文林和谢淑君，1988年）首次以当代的行政区划统计了明朝的人口数，获得1381年大约6700余万，1391年大约7000余万，1393年大约7050余万，1491年大约9200万和1626年大约l亿。根据这五个阶段的数据，以年为加权平均值的计算法，获得明朝时期平均人口数为9300余万。表2.5a列出了明朝各次普查的人口数和推算值。所用的明朝姓氏样本取于《明人传记资料索引》（昌彼得等，1965年）、《天一阁藏明代方志选刊》（上海古籍书店，1961-1964年）以及部分清朝各省“通志”中有关的明朝人物。《明人传记资料索引》收集了明清时期近600种文献，《天一阁藏明代方志选刊》为浙江宁波天一阁所藏明代方志，选刊共107种，我们利用了其中的“科举名录”和“人物传记”两部分的明代人物，根据每一人物的姓名和籍贯，或者居住地进行统计。为了便于与现代的姓氏研究的结果比较，明朝地名省份的归属按目前的行政区划进行归并。台湾省和西藏地区暂未分析。为了便于比较，北京、天津、上海、重庆和海南的资料不单独设立，分别归类于河北、江苏、四川和广东等省，一些较少资料省份与其相邻的省份合并，内蒙古和辽宁的数据合并到河北省，甘肃、宁夏和青海的数据合并到甘肃省，云南的数据合并到贵州省。共收集到明朝112810个人物和740个姓氏。严格地讲明朝的样本与宋、元两朝的样本相同，不是一个完全随机的样本。我们对各省的样本观察值和明朝的人口统计数相比较，同样发现东南地区数省样本数相对较大，造成在文献中各省区之间的样本数不随机平衡的主要原因仍是地区间的经济发展不平衡，形成人才分布不平衡，记录于文献上的地区人物数与地区实际人口数不成比例。为了比较正确地了解明朝时期全中
*此表中明朝历年的人口基本数据引自《中国人口史》（赵文林和谢淑君，1988年）国的姓氏分布的情况，我们依据明朝五次人口的统计值（见表2. 5a）,以年份间隔为加权数计算明朝的全国和各省平均人口数和比重（见表2.5a）,从而推算出明朝时期全国姓氏的期望分布频率。表2.5b列出的是明朝100个大姓的分布频率。明朝的100个大姓的总人口占全国人口的85.1%,比元朝的84.3%高，但比宋朝的86.2%和当代的87.2%都要低；明朝的占总人口1%以上的大姓有19个,其中最大的八大姓分别是王、张、李、陈、刘、杨、吴和黄，宋朝的第四大姓和元朝的第六大姓赵姓却排在第十二位，人口数继续减少，占全国总人口的比例也继续下降。八大姓氏中陈姓比元朝时略有下降，但排名中却升到全国第四大姓。其他七大姓均比元朝时略有上升,但总的人口增长缓慢。
2.6 当代姓氏的分布当代的姓氏统计来自国家统计局人口统计司的1982年第三次人口普查的抽样资料，依据各地人口的比例等距离的抽样，严格地按统计学原理所获得的全国性的姓氏数据，它基本上反映了全国姓氏分布的情况，这是至今惟一的一份有关中国人的姓氏随机分布的资料。总样本为537421人，不包括少数民族。台湾省的姓氏数据来自1967年的全台湾四分之一的抽样计算，我们按万分之五的比例获得台湾的样本4841个。这样全国总共样本为542262人，含有1042个姓氏。最近，我们对全国的数据进行了一次核对，纠正了一些错误，所以100个大姓的排列上有点变动，魏姓由原47位调整到45位，相应的贾姓和丁姓都向后退一位；黎姓和易姓的位子互换。表2.6a列出了当代100个大姓的分布频率。表续表续当代汉族姓氏的分布有两大特征：第一特征为常见姓氏和非常见姓氏现象；第二特征为同姓人群在地区分布上的不均匀性。所谓的常见姓氏和非常见姓氏现象，说的是同姓人群的大小之间存在着很大的差异，而且长期存在一定的分布规律。全国最大的三个姓氏是李、王和张，分别占总人口的7.9％、7.4％和7.1％，其比例都超过了7％，三大姓氏的总人口达到2.7亿，为世界上最大的三个同姓人群。全国占人口1％以上的姓氏有19个，分别为李、王、张、刘、陈、杨、赵、黄、周、吴、徐、孙、胡、朱、高、林、何、郭和马，19个大姓的人口占全国总人口的55.6％。从宋朝以来，各个时期占全国总人口1％以上的姓氏都在18个或19个，历史上，中国大约一半的人口一直集中在这18或19个同姓人群中。当代我国100个常见姓氏，集中了全国人口的87％，人口最多的120个姓氏集中了全国人口的90％，而人口最多的200个姓氏的合计人口已经超出全国总人口的96％。当代大约12亿汉族中使用的姓氏估计在3500个，这说明占姓氏种类不到3％的100个常见姓氏拥有87％的人口，而占姓氏种类97％的一般的和稀罕的非常见姓氏仅仅拥有13％人口。中国人姓氏的分布实际上主要反映了同姓人群的分布规律，中国100个常见姓氏的分布所揭示的是各地人群遗传组成的主要因素，它们决定着中国历史上人口的迁移，决定着地域人群之间的亲缘关系的程度，而非常见姓氏人群则更表现出地域特色和相对隔离的现象。本书的下编将专门逐一地介绍中国100个大姓的起源和历史上分布的情况。我国同姓人群的形成的原因是与我国的婚姻特征和同姓聚居和修谱习俗有关联的。我国农村的婚姻往往受到家庭背景、地理环境、民族差别的限制，“婚姻半径”很小，婚娶地域相对固定，虽然同姓不通婚，但仍存在着姨表婚和姑舅表婚的婚俗。我国的“婚姻半径”平均只有几里，形成了一个庞大的群婚体系，网络相连，地域相依，本村、邻村、邻乡及邻县是他们的娶嫁的固定范围。大部分已婚青年夫妇，婚前都是住在同一个乡，大约90％的住在同一个县，跨县和跨省的很少，表2.6b列出的是我国农村地区20世纪80年代已婚青年婚前的居住地区的调查数据（郑晓瑛《中国女性人口问题与发展》，1995年）。随着经济的发展，我国现行的户籍制度的改革，城镇化的加速，我国婚姻通婚半径和范围将不断扩大，但这并不会影响我国姓氏和基本的同姓人群分布的大格局。我国婚嫁的习俗又使任何一个村庄都可以保持姓氏和血缘关系的长期相对稳定，有的地方一二个姓氏就占全村80％-90％的人口，小姓和外姓往往受到歧视和欺压。就是今后发展起来的城镇，其人口主要的来源仍旧为其周边的乡村，有势力、有群体规模，加上有族谱或联谱的同姓人群仍旧会有相当大的影响。同姓人群的分布在今后会发生多大的变化呢？在我国，农村的人口一直占据着人口的重心，随着经济的发展，农村的城镇化速度加快，农村人口与城镇人口的比重将发生历史性的变化，同时我国历来狭小的“婚姻半径”也将被打破，同姓家族的观念也越来越淡薄。但是，有一点必须要引起注意：我国地域虽然广阔，但可耕种的土地和淡水资源极其有限，各地早已人满为患，不管城镇与农村的人口比例将发生多大的变化，农村的绝对人口是不会发生根本性转变的，也就是说不可能再接受大量的外姓移民，只有本地多余的劳力外流到附近的城镇和城市。对一千年来的姓氏分布的研究证明了中国人姓氏传递是多么的稳定，而且一直是延续的。自从清道光年间我国人口达到4亿以后，可供人民生活的土地都已住满了人，事实上，各类同姓人群的分布在全国早已定局，今后只要不发生亡国灭族之事，不会再发生剧烈的变化。总而言之，中国人的姓氏和分布是中国的一项特有的国情，她将涉及到中华民族的起源、祖宗们遗传下来的基因组资源的分布、当今海内外的寻根和国家大统、今后人口发展趋势和国土利用等重要的问题和研究的领域。中国人姓氏是世界上独一无二的具有中国特色的一种资源。同姓人群在地区中分布不均衡性是中国人口分布的另一特征。在第一章中已经阐明了南北汉族在遗传结构组成上有显著的差异，以武夷山和南岭为界，分为南方汉族和北方汉族，处于长江流域的汉族为过渡型的，既有北方的特征又携有南方的特点，随着纬度的升高和经度的减小，其遗传组成上越接近北方。姓氏的分布也出现了南北差异的现象。南方地区应包括福建、台湾、海＊《中国农村调查资料》（中国社会科学院青少年研究所，1984年）南、广东、广西、香港和澳门七省区，长江流域地区包括四川、云南、贵州、湖南、湖北、江西、安徽、浙江、江苏和上海等省市，其他的省区市归为北方地区。在北方地区，以王姓为第一大姓，大约占人口的9.9％，其次为李、张、刘，分别占人口的9.3％、9.1％和6.7％。而在南方地区，则以陈姓为第一大姓，大约占人口的10.6％，其次为李、黄、林、张，分别占人口的6.5％、6.4％、6.4％和4.6％。在南北过渡型的长江流域地区，第一大姓为李姓，大约占人口的7％，其次为王、张、陈、刘，分别占人口的6.1％、5.7％、4.9％和4.6％。李姓虽分布很广，但在北方地区不是第一大姓，但其频率是最高的，然后向南逐渐地梯度减少。李姓在长江流域地区为第一大姓，其频率为中等。在南方地区，李姓屈居第二，其频率为最低。同样，王、张两姓也存在与李姓同样的分布趋势，北方内蒙古王姓的频率是广东的四倍。而南方陈、黄、林三大姓的分布却与李、王、张三姓相反，由南向北逐渐地减少，最北的黑龙江的陈姓的频率仅仅为广东的四分之一（袁义达，1989年）。姓氏在地区分布上的不均匀性在其他大姓中也存在，比如北方地区的赵、孙、马和刘姓的频率显著高于南方地区；反之，南方地区的朱和吴姓的频率也显著高于北方地区。另外，每一省区中也表现出某些比其他省区特殊的高频率的姓氏，比如广东的梁和罗姓，广西的梁和陆姓，福建的郑姓，台湾的蔡姓，安徽的汪姓，江苏的徐和朱姓，浙江的毛和沈姓，江西的胡和廖姓，湖北的胡姓，湖南的谭姓，四川的何和邓姓，贵州的吴姓，云南的杨姓，河南的程姓，甘肃的高姓，宁夏的万姓，陕西的薛姓，青海的鲍姓，新疆的马姓，山东的孔姓，山西的董和郭姓，内蒙古的潘姓，东北三省的于姓。而周姓在各地分布比较均衡。表2.6c、表2.6d、表2.6e为当今北方地区、长江流域和南方地区各省的前10个大姓的分布表，其中河北包括北京和天津，四川包括重庆，江苏包括上海，广东包括海南。
第三章遗传地形图 3.1样本和分布图样本就是能客观和全面地反映总体的一群代表，通过对样本的分析和样本的统计，来推断总体的数值，以此来描绘和了解总体，这是群体遗传学中常用的研究方法。既然我们研究的是样本，根据实际条件，对样本就有一定的要求和统计学的检验，这样才能获得最理想的样本。从总体中抽取的样本的首要原则是随机性，其次是样本数量的最小原则。当代姓氏的样本是国家统计局人口统计司提供的1982年全国人口万分之五，三阶段整群抽样资料（国家统计局，1984年）。
最小样本数目确定的公式：理论上最少的样本数为53万人。实际上1982年随机取样数为57万余人，把握程度有效地超过了设计要求。三阶段整群抽样方法是按三个层次进行的，省（自治区、直辖市）抽县（市、区），县（市、区）抽乡（街道），乡（街道）抽居民点（村民小组、居民区）。各层次均有其概率比例（国家统计局1984年人口变动情况抽样调查方法）。我们对以上的样本点和姓氏进行了验证，根据姓氏分布的要求，几个点的样本人数太少不能用，可用的样本点为291个，除了少数民族外，又剔除了一些姓氏不明的样本，共获得汉族样本537421人。台湾地区的姓氏数据来自1967年的全台湾四分之一的抽样（陈绍馨和傅瑞德《台湾人口姓氏分布》，1968年），共有19个抽样县（市），我们按万分之五的比例获得台湾的样本4841个。所以，当今全国姓氏的总样本为542262个，抽样点310个，图3.1为抽样点的分布图。宋、元、明三朝的历史姓氏资料来自近千部的文献中的人物，组成的样本并不完全的随机，我们根据当时的各省的人口分布情况加以调整，并用“中性等位基因分布”的理论进行检验，说明了宋、元、明三朝的历史姓氏资料的可信程度。详细的说明见第二章的有关章节。每一同姓人群在各地的分布都不平衡，不同姓氏人群的分布也都不一致，任何文字和数据都不能完整地说明它们的分布形状和与其他同姓人群的关系。绘制姓氏遗传地形图就是为了能在地图上直观地看到每一同姓人群的分布状况，包括其分布的形状、同姓人群的分布中心、聚集区域、扩散趋势、人口密度以及在各地的总人口中所占的比例。我们利用当代姓氏的全国抽样样本，绘制了当今最常见100个姓氏的全国遗传地形图。每一个姓氏的遗传地形图包括两幅图：密度分布图和频率分布图。密度分布图说明某同姓人群在全国的绝对分布情况，即在每平方公里内某姓人口数。频率分布图将揭示某同姓人群在全国的相对分布情况，即某姓占当地总人口的比例。全部200幅分布图已展示在书前并在下编中逐一地给以详细的说明。绘制遗传地形图的原理是：根据全国310个抽样点上的全部姓氏的分布值，对全国其他没有取得数值的点进行插值，获得每一点上的全部姓氏的推算分布值（Shepard 1968,Piazza et al.1981,Piazza and Menozzi 1983）。换句话说，就是用已有数值的点来推测未取得数值的点。取得了全部点的值以后，对全部点按若干不同的值归类，不同值的点用不同的颜色或灰度来表示，最终展示在大家面前的是一幅幅清晰直观的姓氏遗传地形彩图。全国分成93938个插值点，每一点的某一姓氏的插值由310个抽样点上的这一姓氏的分布值来决定，由于每一点到310个抽样点的距离不同，理论上讲距离越远，抽样点的值对其影响越小，反之则越大，原点的影响为最大。修正的插值公式如下：公式中di代表第i个抽样点到插值点的距离，〓和〓i分别代表插值点和第i个抽样点的纬度，y和yi分别代表插值点和第i个抽样点的经度，当然，地理距离的计算不是直线的，还要作些其他的处理。I代表全部310个抽样点，p代表插值点的某姓氏的插值，wi代表第i个抽样点到插值点的距离系数，pi代表第i个抽样点的某姓氏的分布值。用抽样点绘制的遗传地形图也存在缺憾，由于是全国千分之零点五的抽样数据，存在一些点的数据有较大的误差，特别是新疆地区的姓氏数据（参见第二章的表2.2b），主要表现在经插值后新疆等地区的值偏高，在下编中的100个大姓遗传地形图上将会有所显示。但作为整体数据是符合设计要求的，其所反映的每一种姓氏的全国分布图形和发展趋势基本上与现状相符，不合理的地方正是我们在今后需要改正的。但在这次绘制中不能轻易地撤去这些点，以免造成整体不平衡，失去统计学的意义。
3.2迁移率和迁移图中国人历来有同姓聚居和联宗修谱的习俗，而且，“婚姻半径”小，地域相对固定，这样形成了大小不等的同姓人群。中国人的姓氏分布实际上主要反映的是同姓人群的分布规律。在中国，某一村落全体成员都姓同一姓氏的情况是不会发生的，但全体男性为同一姓氏是可能的。相对隔离的群体内的姓氏种类和姓氏比例随意发生变化的可能性很小，而只有当与周边群体发生人员流动才会改变群体内的姓氏种类和姓氏比例。村与村之间、乡与乡之间、县与县之间、省与省之间经常发生着人口的迁移。人口的迁移对人群内的姓氏种类和姓氏比例的改变，人群越小，影响越大。所以说，迁移是影响亚群体的遗传结构的主要因素，也是影响亚群体内姓氏种类结构的主要因素。迁移率是研究人群迁移的主要参数，要取得计算迁移率的数据是十分复杂和非常不易的。虽然，历史文献中频繁出现记录历代人口迁移的大事记，但人口迁移数据不完整，很难统计，至于迁移率则更难确定了。历史文献上还有一种是人物的记录，例如阵亡士兵、烈女等名单。这种记录是随机的、大量的，内容包括姓氏、地区、年代等主要因素，一直不为人们所注意，这是一批十分有用的人口迁移的记录，有可能成为分析人群迁移，特别是同姓人群迁移的素材，是研究姓氏变迁的重要资料。结合历史上人口数，有可能建立一种人群迁移的模式，确立各时期各地区的相对迁移率，供有关学科参考。当代世界最负盛名的美国斯坦福大学的人类群体遗传学家卡瓦利－斯福扎教授，1968年以来发表了一系列有关人群迁移的研究，其中就有介绍用姓氏作为材料的研究文章（Bodmer and Cavalli-Sforza,1968.Wijsman ed.ta，1984）。根据不同时期不同地区的全部姓氏资料，进行姓氏频率的分布的计算，建立各个时期不同地区群体的遗传结构数据库，从而获得不同时期和不同组合的相对的人群迁移率（m），这些迁移率对当时的人群的迁移有一比较合理的估算。推算迁移率m的一系列公式如下：首先建立不同时期不同地区群体的姓氏的亲缘系数（Kinship）的数据库，亲缘系数也即为同姓率（Isonymy），其公式如下：式中S表示全部姓氏种类数，pils表示i地区第一时期中第s个姓氏的相对分布频率，pj2，表示j地区第二时期中第s个姓氏的相对分布频率。全部S姓氏的pils与pj2s乘积总和为Iij12，即表示i和j地区之间在第一和第二时期间的总的亲缘系数矩阵。人群迁移的概念是外来人口的迁入与群体内人口的迁出的差值，迁移率是指迁入总人口与迁出总人口之差值和人群总人口的比值。当迁入人口总和大于迁出人口总和时迁移率为正值，反之为负值。假如人群Nl经过迁移和繁殖后变成N2，其迁移率为m，繁殖率为r，那么有以下公式：可变为式中Nspi代表由S×P组成的长方形矩阵N中的第sp个元素，i表示时间段，S表示姓氏数，P表示地区数。rp代表由P×P组成的对角方阵r中的主对角线上的第pp元素，表示P地区的繁殖率。mij代表由P×P组成的方阵m中第ij个元素的值，表示由第j地区向第i地区的迁移率。e代表两个时期之间发生的全部随机因素产生的影响。设b=rm就有这里n代表人口总数，i和j分别代表第i地区和第j地区，1和2分别代表第一时期和第二时期。公式虽比较复杂，经过计算机的计算很快获得b矩阵中的全部元素的值，为了便于计算，我们假设各省的人口繁殖率一样，那么有：由b=rm公式可分离出迁移率m矩阵中的全部元素，元素mij代表第j区向第i区迁移的迁移率。
以上的迁移率公式的推导，让我们有可能利用姓氏在不同历史时期的分布计算这个时空中人群的迁移率，反映人群的主要流动方向和地域间人群的相对迁移动向。我们利用宋朝、明朝和当代三个时期的姓氏分布的数据获得了宋明期间的迁移率矩阵Msm（表3.2a）和明至现今期间的迁移率矩阵Mmp（表3.2b）（袁义达，2000年）。图3.2a和图3.2b是根据相对迁移率绘制的人群迁移图（袁义达，2000年）。图3.2a表示宋朝与明朝大约600年间的人群迁移状况，在这600年中，中国人群主要从华北地区向东南部江浙闽地区、中南部湘桂地区、西部陕南地区迁移，四川地区人群大批流入湖南和湖北，同时，广东地区的南方人群向北的湘赣地区扩散。图3.2b表示明朝至当代大约600年间的人群迁移状况，在这600年中，中国人群的流动方向有了重大的变化，由南宋时全国人口中心的江浙赣地区开始向北、南和西扩散，长江流域地区人群向北和南流动，造成华北和中原地区人口的快速增长。同时，浙闽地区人口的外移增加了其西南方向上人口的压力，进一步形成了广东地区向北和向西迁移的力量。其次，中原地区和西北地区的人口流入四川，同时四川地区的人口也向湖南地区迁移。这样南北人口逐渐处于平衡。两幅人群迁移图也明显反映了在1000年内，以武夷山和南岭为分界线，中国南北汉族存在差别，提示在历史上一直存在着这种差别。 1000年来中国人迁移的主要原因有三：其一，北部的民族以外族的形象入主中原，原中原人群被迫向南向东南地带迁移，一旦中原政权相对稳定，部分原迁出的人群又返回了原地。其二，相对经济发达的地区和战乱少的东南地区，人口繁殖过快，同样引起人口向外的流动，主要向南部和中南地区流动。其三，自然灾害造成人群迁移。对迁移率的分析不仅反映了这1000年间人群迁移的主要方向和途径，而且也说明了，正是由于人群的迁移才形成了当今各地人群的分布现状。人群迁移的全过程代表了迁移人群所携带的全部遗传基因的流动轨迹，并与当地人群遗传基因交流和重组。不断的人群移动，不断的遗传基因流动，动态的各地人群内遗传结构重组和变化，是形成当今各地汉族的主要原因。
第四章姓氏与血型
4.1 血型分布的地理特征人类红细胞血型有近20种系统，其中最重要的为ABO血型系统。ABO血型发现于1900年，为人类最早识别的遗传基因，已经确定ABO遗传基因位于人类第9号染色体上臂（9q34）上。ABO血型与人类的生活关系十分密切，特别是在临床输血、组织器官移植以及血液免疫学等医学领域上有着广泛应用。ABO血型位点是由O、A和B三个等位基因所组成，在人体中表现出O、A、B和AB四种血型。血型是遗传的，子女的血型由父母的血型所决定，所以，血型在现实生活中扮演了一个十分重要的角色，作为亲子鉴定中的法律依据。我们的祖先是世界上最早知道人体内流动的血液是遗传的，早在13世纪的南宋时已经用滴血法作亲子鉴定，以区别血亲关系。但滴血法并不科学，它根本没有弄清楚血液的成分组成和遗传原理。直到现代科学家揭开了ABO血型的遗传方式，人们才真正了解了血液和血型。一个人的血型是由父亲的精子的血型基因和母亲的卵子的血型基因所决定，其基因的组合称为基因型。ABO血型中O基因为隐性基因，A和B为显性基因。这就是说，当O基因与A或B基因组合在一起时，只显示A或B基因的性状，即A型或B型；而A和B又互为显性基因，当A和B基因组合在一起时，同时显示A和B基因的性状，即AB型；只有当O基因与O基因相结合时，才产生O血型。ABO血型共有6种基因型，由于基因间的显隐性关系，表现型仅仅为四种。这就是我们通常提到的O、A、B和AB四种血型。基因型与表现型的关系见表4.1a。一些家庭中出现父母的血型与子女的血型不一致，或同一对父母的兄弟姐妹的血型不相同，这是正常的现象，是ABO血型遗传的现象。ABO血型的遗传规律是：父母的一方是O型时不会产生AB型的子女；父母的一方是AB型时不会出现O型的子女；父母的血型为O型与AB型的配合时，子女的血型不是A型就是B型，子女不会与父母任何一方的血型相同。表4.2b列出了ABO血型遗传的各种类型。 ABO血型在全国分布是不均匀的，存在地区上的差异。早在1929年，我国学者杨凤鸣按籍贯研究了中国人血型的分布，并发现了我国南北人群的差异（杨凤鸣，1929年），这是中国人第一次根据人类的遗传标记所发现的南北人群的差异。方永禄在1943年对全国20441人的ABO血型的分布资料进行了分析，并把中国人分为蒙古（包括现蒙古人民共和国）、东北、华北、华东、华中、华南、华西和西藏八个类型（Fang Yonglu,1943）。其研究结果表明，在蒙古、东北和华北的人群中B血型占多数，在华东和华中的人群中A型占优势，而在华南的人群则以O型为主，A与B血型基本相等，华西与西藏的人群特殊，O型均少，但华西多B型，而西藏多A型。1963年，尚书颂等分析了15万余人的全国资料，主要为汉族的ABO血型数据（尚书颂和郭寅同，1963年）。按当时的省级行政区划把汉族分为四大类型：B型多于A型的华北型，A型多于B型的华中型，O型比例较高且A型略多于B型的华东型，O型比例很高且B型多于A型的华南型。以上研究中的数据主要以汉族为主，所以结果反映的是汉族的ABO血型分布的情况。中国人最早的ABO血型的正式数据出现在1918年。我们一共收集了655份有关中国人的ABO血型的国内外文献，共计1818180人。除去少数民族的数据，有关汉族的文献325份，计1378892人。为了能比较准确地反映汉族血型的分布，我们对全部的数据进行了哈代－温伯格（Hardy-Wein-berg）分布平衡定律的检验，其中20份的ABO血型的分布不符合哈代－温伯格分布平衡定律，暂时不用。实际上，我们利用了统计学上有效的305份文献，计909900人的血型数据。结果十分清楚地反映了南北汉族存在遗传结构上的差异，以我国南方的武夷山和南岭为界，南北两地的汉族血缘相差甚远，比南北两地的汉族与当地少数民族的差距还要大。从血型分布的结果进一步说明，汉族是在与周边的少数民族长期融合过程中形成、发展和壮大的。从生物遗传学的角度初步证明：我国的汉族只是文化上而非血缘上的完整群体。图4.1a是表示以这305份的中国汉族ABO血型分布得到的地域亲缘图。图中的虚线表示实际的线比这要长，也表明它们之间的生物遗传距离也远。南方人群包括福建、台湾、广东、澳门、香港、广西和海南七省区（特区），长江流域的人群包括上海、浙江、江西、四川（重庆）、湖北、江苏、安徽、贵州、云南和湖南等全部11个省市，其他17个省市区归北方人群。西藏地区暂缺汉族的资料。汉族ABO血型分布的特征，以及呈现的南北汉族遗传结构的差异，与中国人姓氏分布的现象基本上是一致的。
4.2 同姓人群的血型汉族ABO血型分布与中国人姓氏分布的特征均反映了我国汉族南北的遗传组成上的差异，同时，其过渡型地带也都在长江流域上的11个省市。这种现象的吻合不会是一种偶然性的巧合，反映了中国人的姓氏分布与遗传血型的分布存在必然的内在关系。这两者联系的机制是什么呢？中国和世界最近几千年的社会是父系社会，当代各地人群分布的现状是几千年来父系社会进化的结果。我们已经讨论过，中国人姓氏的传递方式与代表人类男性的Y染色体的遗传方式相同，而且姓氏的传递是连续的和稳定的。这就是说，各个历史时期的同姓人群的分布既记录了当时的父系社会进化的痕迹，又反映了人类某些遗传物质在人群中的分化过程。ABO血型就是属于这种遗传物质。ABO血型在人群中的分布是不均衡的，有较强的地理渐变群分布的倾向，即在人群中，ABO血型的频率存在由高向低逐渐扩散的分布状，可以认为ABO血型在人群中的分布特征是自然选择起的作用（大羽滋，1983年）。中国地域人群的ABO血型所表现的关系与中国人姓氏所表现的地域人群的亲缘关系相一致，说明这个“自然选择”中应包括中国特有的父系社会的选择方式——同姓人群。在汉族社会中，宗族观念根深蒂固，直到1949年前，同姓同宗在汉人观念中仍是一种很强的联系纽带。实际上秦汉以来，汉族数以千计的姓氏中，有些发源于远古氏族，有些发源于先秦封国或祖先的居地、官职与名字，也有相当大的部分来自少数民族融入而增加的姓氏。即使是同姓，也有因赐姓或其他少数民族融入而采用汉姓等情况，并不意味着血统上系同一来源。在宗法制度下，汉族的亲属是以父系为中心来论亲疏，父系家族的延续被认为是至关重要的大事。祭祀祖宗，不断烟火，被认为是每个家庭的头等大事。无后则被认为是最大的不孝。汉族古代的国家观念也与家族观念相联系，所谓一家一姓的天下，实际上是父系家族观念的无限扩大。在这种宗法制度和宗族观念统治的几千年中，中国人习惯于同姓聚集，选择几姓联宗的社会生活方式，因此，形成了许多大大小小的同姓人群。中国同姓人群的历史、数目和规模是中国人特有的社会现象，ABO血型的分布受到了同姓人群分布的选择。图4.2a、图4.2b和图4.2c（皆见彩图）分别代表中国汉族ABO血型中的O型、A型和B型的分布。在下编中我们将详细介绍中国100个大姓的ABO血型分布情况。

知识出处

《中国姓氏群体遗传和人口分布》

出版者：华东师范大学出版社

本书内容包括：中国姓氏群体遗传(绪论、姓氏分布、遗传地形图、姓氏与血型)，当代大姓及其分布规律。

阅读

福建省少年儿童图书馆

上篇 中国姓氏群体遗传

内容

知识出处

《中国姓氏群体遗传和人口分布》

上篇中国姓氏群体遗传