Skip to content
This repository has been archived by the owner on Mar 1, 2022. It is now read-only.

SmoothNLP101 开发指北

Ruinan Zhang edited this page Mar 11, 2020 · 11 revisions

指北教程

如果你想成为SmoothNLP的小伙伴或者以为Outside Contributor, 请先自行搜索并学习以下这些Topic来帮助你更好的理解本项目 :)

Git

  • 什么是.gitignore文件, 它的文件格式是什么? 一般什么样的文件需要写入.gitignore ?
  • git merge 出现 conflict 需要处理些什么?
  • 怎样提交git pull request
  • git stash 什么时候用? 它的功能是?

Python

  • 什么是python decorator ? 何时该使用?
  • python 原生package
    • datetime (怎样在UTC与localtime转换; mktime,gmtime这些function的作用是?)
  • 什么是global variable? 怎样使用?
  • 什么是pypi package? setup.py下的核心字段是怎样定义的?
  • 什么是decorator? 什么情况下该使用?
  • 关于代码规范, 请严格遵守PEP-8规范, 具体可以看这里

Java

  • Abstract Class 与 Interface 的使用区别
  • Maven项目的结构
    • Pom文件的编写有常规的哪几个部分
  • API请求
    • GET请求时注意参数的中文乱码问题。URLEncoder.encode(param,"utf-8")

Linux

  • linux中: user, group, sudo user 的概念
  • linux中怎样修改文件的owner
  • linux中怎样修改其他user的访问全向(rwx)

NLP

  • 什么是sequence tagging/generation模型? 常见的模型有哪些?
  • 词性标注
  • 依存句法分析
    • 依存句法树(Dependency Tree) 是怎样定义的?
    • 依存句法树(Dependency Tree) 任务设计到哪些任务?
    • 依存句法树(Dependency Tree) 最优解的复杂度? greedy解有哪些?
  • word2vec有哪些常规算法?

编码

  • 什么是 unicode,utf-8,GBK ? 及他们之间的关系?

Docker

  • 怎样撰写Dockerfile?
  • 什么是image? 什么是container? 他们的区别是?
  • 使用docker有哪些优势
Clone this wiki locally