这些由基因 、蛋白和细胞搭建起来的系统 ,可进行基本的计算机逻辑运算 : “如果 /就 ” ( I F / T H E N )判断 , “与 ” ( A N D )和 “或 ” ( O R )运算 ,甚至一些简单的算术运算 。一些系统还具有初级的数字存储功能 。输入恰当的生物信号 ,这些活的生物计算机便可以 (在大部分情况下 )输出可以预测的结果 。
不仅如此 ,这种技术还能以更快 、更廉价的方式生产复杂的化合物 ,比如生物燃料和药物等 。另外 ,我们还可以设计出能够监控和降解有毒物质的生物体 ,将它们散播进生态系统 ,以应对泄漏 。当然 ,这并不是说生物计算机目前已经相当先进 。恰恰相反 ,这个领域目前仍然处在起步阶段 ,如果把生物计算机想象成 i P h o n e那就大错特错了 ,请把它想成 C o l o s s u s 。 C o l o s s u s是最早的可编程电子计算机 。如果你穿越时空来到 1 9 4 4年的英国 ,走进位于伦敦北部的布莱切利园 ,当时绝密的密码解读中心 ,就可以看到刚投入使用的 C o l o s s u s正在呼呼地运转 ,纸带在滑轮上快速移动 , 1 6 0 0个真空管嗡嗡作响 。以今天的标准来看 , C o l o s s u s简直原始得可笑 。正如 c o l l o s s u s这个词本身的含义 ——“巨大 ” , C o l l o s s u s填满了整整一间屋子 ,但它只能执行有限的几种运算 ,而且无法存储自己的程序 。
设计 、载入和测试一个程序往往需要几天或者几个星期的时间 ,而且操作者每次都得给机器重新连接线路 。尽管有这些限制 ,但 C o l o s s u s可以破解纳粹用来给最重要的消息加密的密码 。这个笨重的初级计算机最终帮助盟军赢得了世界大战 。数十年之后 ,它的后代驱动着人类文明从工业时代到信息时代不断进步 。
目前最出色的生物计算机 ,实际比 C o l o s s u s还要更加简单 、缓慢和无能 。与早期的数字电子计算机一样 ,生物计算机并非总能可靠地工作 ,它们只能运行非常简单的程序 ,离开实验室后不能重新编程 。但是 ,我们看到生物计算机具有给社会带来变革的潜力 ,正如诞生之初的数字电子计算机那样 。即使是一点点计算功能 ,巧妙运用的话 ,也可以对生命系统产生近乎魔法的效果 。细胞计算机不太可能替代电子和光学计算机 。生物学不可能赢得与固态物理学的比拼 。不过生命的化学机制拥有自己的独特力量 ,而且可以通过电子系统无法胜任的方式与自然界交互 ,毕竟 ,自然界有很大一部分是遵从生物学规律的 。
从某种意义上讲 ,我们体内的每一个细胞都是小型的计算机 。生化分子接触细胞表面 ,为其输入数据 。然后 ,细胞会通过体内错综复杂 、层层级联的分子相互作用处理这些数据 。这些反应有时会影响细胞 D N A中一个或多个基因的表达水平 。 “表达 ”指的是基因转录成 R N A ,然后再翻译为多个由该基因编码的蛋白质分子 。类似的 ,经化学计算后输出数据的现象还有腺细胞分泌激素 ,神经细胞产生电脉冲 ,免疫细胞产生抗体等 。
作为合成生物学家 ,我们致力于利用细胞天然的信息处理能力 ,运行我们自己设计的程序 。我们渴望大幅超越传统的遗传操作 ,诸如敲除一个基因 、启动一个基因或者从其他物种转入若干基因等 。我们的目标是像电子工程师设计电路板一样 ,从目录中选择标准化的元件并将它们连接起来 ,快速可靠地操控多种不同细胞 (或者细胞群体 )的行为 。可惜的是 ,生物学和电子学在很多方面都存在巨大差异 ,令我们的雄心受挫 。后面我们会详细解释这些差异 。虽然进展缓慢 ,但这一领域目前已经取得了坚实的进步 。第一个重大进展出现在 2 0 0 0年 ,波士顿大学的詹姆斯 ·柯林斯 ( J a m e s C o l l i n s )和同事将两个相互干扰的基因组合在一起 ,制成了可以在两个稳定状态间切换的基因开关 ,从而实现了 1个比特的数字存储 。另外 ,普林斯顿大学的迈克尔 ·埃洛维茨 ( M i c h a e l E l o w i t z )团队在大肠杆菌中植入了一个初级的振荡器 。经过改造的大肠杆菌能周期性地打开和关闭荧光蛋白基因 ,可以像圣诞节的彩灯一样一闪一闪发光 。
2 0 0 3年 ,当时在普林斯顿大学的罗恩 ·韦斯 ( R o n W e i s s )设计了 “金凤花姑娘 ” ( G o l d i l o c k s )基因回路 :当环境中特定化合物的浓度刚刚好 ,不太高也不太低的时候 ,这个基因回路会让细胞发光 。这个系统连接了四个反相器 ,这些反相器可以将高信号 (指浓度高 )转换为低信号 (指浓度低 ) ,或者把低信号转换为高信号 。
几年之后 ,加利福尼亚大学伯克利分校的亚当 ·阿金 ( A d a m A r k i n )和同事设计了可遗传的存储系统 。这个系统在启动后会利用重组酶从 D N A上裁下一小段 ,然后将这个片段翻转 ,再放回到原先的位置 。这样 ,修饰后的 D N A片段就可以在细胞分裂的时候 ,稳定地遗传给子代细胞 ,对于每隔 1 ~ 2个小时就分裂一代的细菌来说 ,这是非常有用的方法 。以上所讲的都是可实现单个操作的元件 ,将不同的元件组装起来实际上要复杂得多 ,但也更有用 。目前 ,合成生物学家已经设计出了可以执行数字逻辑的所有基本布尔运算的基因元件 ,包括 ( A N D 、 O R 、 N O T 、 X O R等 ) 。
在 2 0 1 1年 ,两个研究团队分别将单个逻辑门植入细菌细胞 ,并为细胞编程 ,使它们可以通过化学信号相互联系 ,从而创造出了多细胞生物计算机 。瑞士苏黎世联邦理工学院的马丁 ·富塞内格尔 ( M a r t i n F u s s e n e g g e r )和西蒙 ·奥斯伦德尔 ( S i m o n A u s l . n d e r )以及他们的同事将简单的合成生物学元件组装起来 ,实现了可以进行简单算术运算的高级系统 。本文作者卢冠达与柯林斯和哈佛大学医学院的乔治 ·丘奇 ( G e o r g e C h u r c h )等人合作 ,将可遗传的存储元件级联起来 ,植入到大肠杆菌中 ,从而得到了可以计数到 3的系统 。细菌的存储状态在细胞分裂的过程中可以完整保留 。这是非常有用的工具 ,因为我们可以将过去的生物化学事件记录下来 ,以便在将来合适的时候检索 。
2 0 1 1年 ,由目前在麻省理工学院的韦斯 、清华大学的谢震和瑞士联邦理工学院的雅各布 ·贝嫩森 ( Y a a k o v B e n e n s o n )组成的团队创造出了非常高级的基因逻辑运算系统 ,如果一个细胞包含特定的癌症特征 ,这个系统就可以让细胞自我摧毁 。这种基因回路会监控 6种不同的生物信号的水平 ,这些信号主要是调节基因表达的 R N A短序列 ,即 m i c r o R N A 。在源自人体的癌细胞 H e l a细胞中 ,这 6种 m i c r o R N A信号构成了一种独特的表达模式 。在 H e l a细胞中 ,这个基因回路会打开基因自杀开关 ,产生可以指引细胞进入自杀程序的蛋白 。而在非 H e l a细胞中 ,这个基因回路处于失活状态 ,不会驱动细胞自杀 。包括我们自己在内的其他研究团队证明 ,生物计算基因回路可以执行基本的加减 、除法和对数运算 ,可以将 2位的数字信号转化成以蛋白质水平表示的模拟输出 ,还能记录所有逻辑门的开关状态并可以将信息传递给子代细胞 。
去年 ,我们团队与同在麻省理工学院的克里斯托弗 ·福格特 ( C h r i s t o p h e r V o i g t )团队合作 ,开发了可以在哺乳动物肠道内工作的生物计算微生物 。我们使用小鼠作为测试对象 ,但我们选择进行遗传操作的 ,多形拟杆菌 ( B a c t e r o i d e s t h e t a i o t a o m i c r o n )是天然存在于人体中的 ,几乎一半的成年人肠道内都有大量的这种细菌 。此前 ,哈佛大学医学院的帕梅拉 ·西尔弗 ( P a m e l a S i l v e r )和同事曾改造大肠杆菌 ,使其在小鼠的肠道中按设计运作 。
基因回路可将细菌变成间谍 。当细菌在肠道中徘徊的时候 ,会把自己的部分 D N A用作笔记本 ,记录是否遭遇了某种预定的化学成分 。我们以一种无害的药物为试验对象 ,给小鼠喂食 。这种药物在宿主患有特定疾病的时候 ,很容易转变成毒性分子或者生物标记物 。让小鼠摄入这些药物后 ,我们可以检测它们排出的粪便中的细菌 。这些细菌起着监控作用 ,如果它们曾经接触过前面提到的药物 ,基因回路就会让细菌产生荧光素酶 ,这种酶可以在黑暗中发光 ,尽管非常微弱 ,但是我们可以在显微镜下观察到 。不难想象 ,这类生物计算系统对于患有特定肠道疾病的患者特别有用 ,比如炎症性肠炎 ( i n f l a m m a t o r y b o w e l d i s e a s e , I B D ) 。
很快 ,我们就可以为天然存在于肠道中的无害细菌编程 ,用它们找出和诊断早期癌症或 I B D 。这个生物计算系统可以改变粪便的颜色 ,或者为其添加化学成分 ,这些成分可以用类似家用早孕试纸的廉价工具进行检测 。挑战前面提到的细胞哨兵并不需要特别复杂的逻辑运算就可以给目前的诊断方法带来巨大的进步 。简单的 I F / T H E N ,几个 A N D和 O R逻辑门 ,以及 1位或者 2位的持久存储元件就已经足够了 。对我们来说这很幸运 ,因为相对于电子计算系统 ,生物计算机需要面对更多的挑战 。与电子线路上千兆赫的运算速度相比 ,生物计算机的速度简直跟蜗牛一样 。当我们把数据输入基因系统后 ,通常需要数个小时才能看到输出结果 。