疾病本身可以表达为多序列的耦合,我们可以通过对序列的处理来做到诊断、预防和治疗。当然这个前提是我们建立这个数据库,如同基因组对细胞的基因序列的测量。扪心自问,我们走到道路和功能基因组学是一致的,只是我们选择运算的序列很不一致,他们是从底到顶,希望对基因的研究一直遍历形成高维的人体机能研究;我们希望的是从顶到底,把复杂的人体变化不断分解为不同范围的层次。当然我们终将相遇。
相比与其他的疾病,我们认为遗传病是比较底层的,即机体的代偿概念发挥的用处不大,使得我们有能力观测特定的变化能够在宏观的层次发挥的作用。这种高概率的相关性对于数学的推导比较友好,如唐氏综合症是21三体综合征。我们暂时不用考虑环境因素和遗传因素交互作用。当然我们只希望能够以此为基础构建序列数学结构来解释这种相互作用的,但是现在还无能为力。
血型的分类就是机体网络的序列的一种例证,而这些序列的竞争可以与基因和基因型的发展即平衡定律来解释其最后的均衡状态。
如同地中海贫血、镰状细胞贫血等等都是比较底层的,接近中心法则的,我们对中心法则的应用对于疾病的解决有着极大的意义。这就是基因治疗的斩草除根的思想啦。我们不一定要做到基因的转导,可以通过rna的对基因表达的调控也可以起到一定的作用。如我们可以通过在体内外置一个细菌工厂来持续施加影响,或许能够保持机体的健康生活状态。因此我们需要找到运算的对象,之前一直都是找到确切的基因和酶,我们认为这是一种不动点的确至关重要,但我们可以采取一定的替代的方式即找到更大范围的相关的基因和酶来通过贝叶斯公式把其影响堆积到一定高度。
那么这种序列如果被观测理解呢?我们需要引用中心法则的一些关系来构建这种数学结构。即我们需要一定的可重复的研究来证明其与一般的结构性的序列(acgt)的等价性。算法的复杂度是否可以作为一种度量?因为序列内部的耦合和模式涌现也是重点。
系谱分析可以视为是对不动点的分析,可以作为序列的一部分来处理,当然对序列整体的研究是大规模的大量级的。其中单基因的显隐性是序列的选择性表达的结果。完全显性和不完全显性和共显性和不规则显性和延迟显性和从性显性都是这种选择性表达,即都是概率的表达。
而多基因遗传病则是序列运算的一个很好的例子。可以分解为亚层的模块:各对等位基因对遗传性状形成起一定作用,共显性,累加起来可形成明显的表型效应(如同微积分)。各种分布的函数就是序列的分化,而根据其具体的位置来制定一定的阈值可以简化为单基因。
具体的位置确定是对有意义的序列的处理,各种荧光染色等等手段可以在宏观上确定。当然,算法的seed序列的寻找。
由于分形结构的层次相似性,我们能够在群体水平的频率来发现个体水平的各种规律。平衡定律应该是普遍存在的,这可以接受序列的竞争博弈达成的均衡。而且基因的定义所用到的探针也是利用序列的相似性来耦合,只是遗传病的诊断需要更高维度的序列匹配,如一系列的症状和检测。