宋河顺手开了一个新程序,按伊雷马实验室数据,同步复现药物预测流程。
别人做的成果,他不敢全盘接收,还是亲自上手验证一下稳妥
首先是经典的ddis预测,即药物药物相互作用,探讨病人短时间服用多种药物后,产生的复合效应。
当初在京海大学实验室,吕承恩讲过中药预测五原则,相反为制、相畏为制、相喜为制、相资为制、相恶为制,也是药物和药物相互作用的原理,只不过现代的ddis预测深入到分子层面了。
之前宋河看相关论文时,见过基于图卷积神经网络的ddis预测,以及基于平衡理论的预测。
前者太片面,只考虑邻接矩阵元素。而后者则太绝对,总结起来就是“朋友的朋友是朋友”、“朋友的朋友是敌人”,但实际的药物研发中,关系远比平衡理论要错综复杂。
电脑屏幕上,伊雷马实验室居然两种方法都弃之不用,赫然使用了新方法进行ddis预测
宋河研读许久,基本明白了思路大数据库推导
伊雷马实验室尝试将海量化合物进行拓展,梳理出亲戚关系,画出一个壮观的树状图,每个枝丫都连接一种相似的化合物。
之后,再通过已经确定的化合物药用特性,大胆猜测未知化合物的药效。
这感觉好比,知道丈夫是生物学家,知道妻子是短跑运动员,于是便猜测这对夫妻将来的孙子能够一边短跑冲刺一边手拿显微镜观察细菌
本质上还是瞎猜药物,但在瞎猜中多了一丝丝牵强附会的推理。
“好难”宋河吐槽。
他在帖子里寻找伊雷马实验室用的大数据库。
找了半天没找到
“怪不得呢原来公布的只是边缘数据,最核心的没公布啊”宋河摇头失笑。
没办法,他只得尝试自己搜集数据库。
他先在网上寻找,用过相似工作方式的科研团队。
花了许久,总共找到两个。
一个是千度公司合作的研发团队,通过大量食管癌病人的数据,寻找到22个显着突变基因,随后预测关联出可行的药物信息。
一个是sk癌症中心,开发了一个体细胞突变相关的知识库,收录了大量靶向药。
“都是做癌症的数据库,用不上啊”宋河挠头。
思前想后,他掏出手机,找相晓桐老师场外求助。
“老师,我需要一个安眠药相关的大数据库,做药物预测用,您知道从哪能弄到吗学生万谢”
刚发消息,宋河马上后悔,大半夜的,会不会打扰老师休息
没想到过了几秒,回复便来了。
相晓桐“我知道谭西教授的团队自建了一个安眠药数据库,但谭西那人小心眼,断不可能给你。”
相晓桐“这样吧,我团队里有黑客,帮你上网抓一些相关数据下来,能抓多少不确定,你做个参考。”
宋河连忙回复,“谢谢老师学生简直不知道该怎么感谢您好了”
相晓桐“回头跟着我学脑的时候,好好干活就行。”
一小时后,相晓桐一股脑扔来大堆数据文件。
宋河打开看,每一份文件均为庞然大物
海量的数据,杂乱不堪,有他想要的化合物分析,有奇奇怪怪的废数据,大部分来自世界各地医药组织的数据库,千奇百怪的语言齐聚一堂,光是机翻都要很久。
如果自己单独干,仅仅梳理完这些数据,恐怕都得拖到过年
宋河幽幽长叹一声,看来这次做短眠药,必须雇佣实验团队了
和军用的环形山炸药不同,短眠药这东西主要是商业价值,无需过于水泄不通的保密措施,招些可靠的人手来干活,注意分工即可。
宋河在反间谍教材上,学过一种行之有效的保密方法,盲人摸象法。
大型项目常用这种方法,将工作人员分小组,每组只负责一小部分操作,各小组之间严禁互通消息。