生物分类与信息检索的简易化

5.6 信息检索的简易化

《生物学思想发展的历史》恩斯特·迈尔著涂长晟等译 https://tuenhai.com 整理

进化分类学家关于亲缘关系所取得的结论由系统发育图（phylogram）表示，图中对分支点的确切位置以及每一线系（phyletic lineage）的分化程度（即独有衍征的数目）给予同等加权。进化分类学家运用这系统发育图作为他们的概括的依据

但是分类还有另一个功能：作为贮存于该系统的信息的检察。为了使分类成为最有效的信息检索系统，在将系统发育图转译成分类时就必须考虑分类的某些方面，“等级”（rank），“分类单位大小”（Size of taxa），“对称性”（symmnetry），和“顺序”（Sequence）等这些术语就是指的这些方面。在确定这些方面时不可避免地会有主观性，因而它们将可能构成长期争论的焦点

在林奈的等级结构中，等级是由给定的分类单位所处的阶元表示。等级的确定是分类中最困难也是最武断的决断过程。对支序分类学家来说，等级是由系统树的最近分支点自动地决定，因为姐妹分类单位必须具有相同等级。与此相反，进化分类学家就必须决定多少个独有衍征及其加权才能判定两个姐妹群之间的等级差别，而当不同种类的性状提供的证据互相矛盾时要作出这样的决定就特别困难。例如，某个分子分类学家由于它们的高分子相似可能把猩猩和人放在同一个科中，而赫胥黎因为人类的中枢神经系统及其能力而独具的特征建议将人类的等级提高成为单独的界（Psychozoa，灵生界）。现在还没有解决这类矛盾的硬性规定，只能说应当照顾系统的整体平衡，并采取一种能够作出最有效的概括的等级标准

分类单位的大小

关于分类单位多大最合适的问题在分类学家中意见更不一致。某些学者认为只要有少许差别足以辨认出新的属、科、高级分类单位就可以。在分类学的行话中这些人被称为“主分派”（Splitters）。绝大多数分类学家则中意于大的，综合性分类单位以便能更好地表示亲缘关系和便于记忆。他们被称为“主合派”（lumpers）。从林奈时期起这两派一直争论不休，林奈本人是一个主合派，他在界以外只用了阶元等级结构的四个层次（种，属，目，门）就能应付自然界的多样性。目前甚至相当保守的分类学家也确认了21个阶元等级（Simpson，1945）。林奈对整个动物界只确认了312个属，而现代的动物学家则确认了十万个以上的属，其中单只鸟类就有2045个属。作为一般的规律可以说大多数分类学类群当它们被人们积极研究时就会经历一个强化的分化阶段，而当对类群的知识更成熟时，这种分化阶段就会逆转。广泛的一致意见是分类作为一个信息检索系统的索引功能就对分类单位的大小和等级结构中的等级数目施加了约束

数值分类学派是唯一努力从事于在分类单位的等级安排上引进一致性和非主观性的现代分类学派。运用根据形态性状（ Sokal andSneath，1973）或依据遗传距离（genetic distance。Nei，1975）的各种测定距离的方法，他们提出了供类群分隔（genericseparation）用的为物种类别定性的绝对差异度（absolute degreesof difference）。当距离的测定具有足够的广泛基础（例如DNA匹配，或至少具有30个或40个、最好更多基因座的同功酶），就能很充分地反映各种不同物种类别的进化分化量（amount ofevolutionary divergence）。有证据表明如果形态学分化程度和分子分化程度严重不符，依据分子差异程度的类群辨别标准在不同的高级分类单位就应有所不同。形态上极其相似的种如蛙与蟾蜍可能显示明显的分子分化，而在鸟类和哺乳动物类群中形态和色彩型式的明显分化却并不反映任何重要的分子分化。如果采用统一的分子标准，则许多早已确认的温血脊椎动物的属将会成为同义词而消除，而在无尾类动物中和腹足类动物中将会出现许多新属来代替形态非常相似的物种类群。考虑到分类的主要功能，这样做究竟是否有必要的确值得怀疑

对称性

对称性问题是由进化而不是分类学家提出的。如果每一阶元层次的所有分类单位的大小都相同就达到了理想的对称。对五元论者来说，理想的数字是五。当自然神学仍然支配着博物学家思想的时候就首先提出了一切分类单位应当具有大致相同数目的物种的想法。这个问题首先由 A．von Humboldt加以研究，随后有von Buch，1835年另有一位佚名的昆虫学家讨论这个问题的文章引起达尔文注意。分类单位的大小极不一致看来是如此变化无常不值得造物主去计划安排。遗憾的是，进化（连同灭绝）的确是如此变化无常的。有些动物的整个一个目只有一个种，而有许多属，特别在昆虫中，却有一千以上的种。现在已经清楚物种形成的速度及其存活在自然系统的不同地域是极不相等的

顺序

在分类中最棘手的问题也许是将系谱树转变成线性序列（顺序）。只要认为只有一种单一的完善标准，则在原则上这个问题也很简单。就像拉马克所说的，从最不完善的升物开始，最后以最完善的结束。当居维叶摧毁了自然界阶梯时，他发现在性状的从属关系上有一种新的顺序标准。他否认在他所确认的四个（动物）门之间有任何连续性，然而按照它们的中枢神经系统的发育程度而安排等级显然就指定了顺序，从而也就维持了完善标准的基本思想。接受进化思想对分类学的顺序见解并没有什么影响。自然界阶梯所表达的意思只是提出了一个进此循环：“比较完善”的升物变成了“更加进化”或“比较高等”的升物。实际上动、植物的一切分类都是依据这样一种明确的或含蓄的原则：比较原始的或比较低等的升物先安排，比较高等的后安排。然而到了适当的时机人们就会深思比较高级这个词的意义。为什么鱼类就应当比蜜蜂高级？为什么哺乳动物应当比鸟类高级？寄升物和它所由来的自由生活类型究竟是哪一个比较高级？

随着动物和植物的亲缘关系的研究日趋成熟，就越发清楚既不是一种完善标准也不是简单的系谱树能够正确地描述自然界的多样性。更正确地说，最好是把大多数类群的升物看作是高度复杂的系统发育的灌木，具有无数的相等分支：每个分支由很简单的原始祖先开始，以十分复杂的和特化了的后裔结束。适应幅射这一事实使得不可能建立一种真正合乎逻辑的分类学顺序学说。在大部分自然系统中不可能论证某种分类学顺序优于另一顺序。因此，日益增长的趋势是采用有利于信息检索的纯粹实用标准（Mayr，1969）。最重要的原则是保留一切普遍接受的顺序，除非已经肯定证明它将无关的分类单位捏合在一起。分类学文献中关于被子植物目或鸣禽科的最佳顺序的不断争论表明这些最低限度的约束也不足以保证稳定性；然而线性顺序却是实际需要。收藏中的标本是按线性顺序安排，一切订正研究，目录和评论的印刷文字也是如此

系统学的现状与未来

鉴于分类学是升物学中最古老的分支，其目前的活力与势头的确是不寻常的。这具体表现在一些新的分类学杂志先后创刊［如《分类学》（Taxon），《系统动物学》（Systematic Zoology），《系统植物学》（Systematic Botany）等等），出版了整套的重要教科书，召开了多次国际讨论会以及日益增多的年鉴类文献资料。它所涉及的研究领域很广泛，并不仅仅限于分类方法。单就描述新种来说就是一项永无尽头的工作。近几十年来新发现的或至少是确认的类型的数目更为惊人。例如须腕动物门（Pogonophora）这个新的门直到1937年才被描述，而颚口亚门（ Gnathostomulida）则更晚（1956）。现今仅存的硬骨鱼中的空棘目双脊鳍矛尾鱼（Latimeria）发现于1938年，原始软体动物Neopilina发现于1956年，古甲壳动物Cephalocarida发现于1955年。过去50年中还发现了丰富的潮间带动物区系。最原始的后生动物毛面虫属一直迟到70年代才被发现

最惊人的发现也许还是Barshoorn，Cloud和Schopf对前寒武纪化石的描述，他们将地球上的生命历史从6.5亿年推前到35亿年。但是有时仅仅对现存的化石更加仔细地加以研究也会有所发现，近年来对寒武纪早期就已灭绝了的无脊椎动物Asmata门的描述就是一个例子

从细菌、真菌、原生动物一直到脊椎动物（包括灵长类）的一切升物的高级分类单位分类的进展也显示了近年来分类学研究的活力。腔肠动物的祖型究竟是水螅还是水母这个长期未能解决的争论近来也已通过多方面的研究得到澄清（绝大多数分类学家认为是水螅）。钵水母纲（Scyphozoa）较之其它类型的腔肠动物具有更多的祖征，而新近确认的立方水母纲（Cubozoa）（Werner，1975）将之与水螅纲很出色地联系了起来。Thorne，Carlquist，Cronquist，Stebbins以及Takhtajan等人对植物的研究导致被子植物的彻底重新分类。但是亲缘关系不清楚或完全不知道的高级分类单位的数量还很多，还有待今后努力

早在林奈时代，甚至更早（亚里斯多德）就将升物分成植物界和动物界。真菌和细菌被看作植物。近几十年来对单细胞升物和微升物研究愈加有所进展就越发认识到这种分类的人为性。首先是认识到蓝绿藻和细菌与其它一切升物根本不同因而将之归类为原核升物。它们缺少有结构的细胞核和复杂的染色体，而且和其它升物（真核升物）在绝大多数的高分子上也不相同。在细菌中也具有多样性（代谢和其它方面），然而即使分化最大（显然也最原始）的细菌类群甲烷细菌也具有许多其它细菌的共同特征，因而最好的办法是将它们一并归入原核升物界（Monera）

现在一般也将真菌列入一个单独的界以脱离植物，它们和植物不仅在代谢上不同（不进行光合作用），而且在细胞结构上也不相同（永远是单倍体）。究竟是否要为单细胞动物、植物另立一个原生升物界（Protista）是一个判断力问题。因为原生动物和单细胞藻类的文献和后生动物、后生植物的文献都是分开的，所以单独分出一个界可能有利于信息检索。Margulis（1981）曾经讨论过这些问题

升物分类之所以能取得稳定的进展原因有很多，其中最重要的是分类方法的改进。现在已经认识到分类不是一步程序，不能一蹴而就，因此过分简单化的方法很少能取得满意的结果。分类是由一系列步骤组成，（Mayr，1981），在每一步骤中需用不同的程序和最有效的方法。例如数值分类法在首先试验性地划分分类单位时以及根据支序分析差异程度安排分类单位等级时最为有用。支序分类法则在检验由推论得出的分支模式上最为有用

数值分类法在什么程度内有效并超过人的头脑这个问题并没有解决。形态学性状由于趋同现象，复系（多源，Polyphyly）现象和镶嵌进化而难于解释以致不十分宜于作为数值分析的素材。趋同和复系现象在高分子（可能是DNA）的进化中也出现，但是也有征象表明高分子的某些变化对这些分子的随后进化施加了如此强大的约束力以致于只要有足够大量的高分子同时被评价，则分子相似性要比皂白不分的形态表征分析更为可靠，这一点正是数值分类学派最初提出的

独立思考最难得，赞赏支持是美德！（微信扫描下图）

海云青飞 官方网站

生物分类与信息检索的简易化

5.6 信息检索的简易化

等级

分类单位的大小

对称性

顺序

系统学的现状与未来

海云青飞官方网站