请申请加入有道云协作的组织:
http://note.youdao.com/group/redirect.html?type=org&inviteCode=DD2B576A51F54B88A02B56865344B6E3
里面有一个“文档”,有全部共享文档。如无法加入,请找各组的scrum master。
知识图谱-基因组 小组会议纪要 #1 2017年7月24日19:30
1 参会人员
陶斯琴,陈钢,池振奋,黄凯波,聂凌虎,Joe Zhu,王阳
2 会议概要
2.1. 参会人员自我介绍
2.2. 明确项目主题:基于药物基因组数据的知识图谱构建
2.3. 初始阶段任务和分工
3 主要内容
3.1 参会人员介绍和对项目的看法
(1)陶斯琴 毕业1年,专业领域为深度学习,工作涉及文本挖掘,爬虫 认为phramKB数据库的数据维度比较丰富,可以用于本组的知识图谱项目。
(2)陈钢 计算机博士,基因检测机构wegene CEO phramKB项目可立即转化应用。可以为本项目提供funding 文本的理解,生物学的描述, 建议本项目以始为终地开展,即最终注释基因组想怎样注释,给用户进行怎样的呈现。 可以由生物信息背景同学和数据库设计同学先协同定下初步的脑图框架。
(3)池振奋 北京基因组研究所,专业领域癌症的发生机制研究 计算机方面的技术了解较少,希望通过项目进行学习。
(4)聂凌虎 对wiki pedia感兴趣2013-2014年做过基因百科,1000多个词条,手工录入,是一个很艰苦的过程。大医学百科,坚持了2年,越来越艰难。后来了解到知识图谱技术
对项目的建议:phramKB,业内足够权威,选题足够好,先把该数据库爬下来,然后再考虑与其他数据库的融合。 药物-使用药物的对应关系 爬虫-数据库-可视化-图谱
(5)Joe Zhu 数学和统计背景,基因组数据接触多。对github熟悉,程序的coding较少,可以进行代码测试工作。 pharmKB,下载信息不完整,好多解释性信息下载信息中没有 用药建议这些信息是没有的,下载的信息可以做一个基础的库,做爬虫的索引
(6)黄凯波 本次的项目是一个各个专业背景的人协作完成的项目,编程,数据分析,角色和人设都要脑洞大开。 技术只是一部分 数据库之间的比较和校验是一件很有意义的事情
(7)王阳 生物学专业,目前从事生物信息分析工作,爬虫入门。
3.2. 初始阶段任务和分工
陈钢老师:负责初始的方案,给出文字版本的需求列表
王阳、振奋:脑图概念库
黄老师:可以帮助指导建立物理库
知识图谱-基因组 小组会议纪要 #2 北京时间 2017年8月2日20:00-20:30
1 参会人员
池振奋,黄凯波,聂凌虎,Joe Zhu,王阳
2 主要内容
2.1 工作进展
调研了各大主要药物基因组数据库,未完成预定项目脑图绘制
2.2 下阶段任务
池振奋,聂凌虎,Joe Zhu,王阳:共同完成项目脑图绘制
黄凯波:共享开源项目的配置文件;督促项目开展
调动大家参与的积极性
3 其他
3.1 医疗组王建峰老师在框架搭建方面具有丰富经验,可以请教咨询
3.2 黄凯波老师在钉钉共享的前端展示参考文档,可查看学习 《Visualizing an OrientDB Graph Database with KeyLines》
3.3 推荐阅读 CS图论方面的书籍 Google knowledge graph 有关内容