English | 简体中文
:ArtificialZeng 超220w点击CSDN: AI生成曾小健 全网技术博客超300w浏览
发起项目主要有大模型训练,和大模型代码解析(逐行)两块。还有一些重大项目的微小贡献。
Baichuan微调训练 *** 百川微调训练源码解析
ChatGLM2-6B-Explained *** ChatGLM-Efficient-Tuning-Explained
Company | Project | Stars | Description | Version |
---|---|---|---|---|
### 大语言模型 ### | ||||
llama3 | Meta的最强开源模型 | |||
Baichuan2 | 百川智能第二代7-13B(9.6发布) | |||
Qwen | 阿里7B/14B SOTA聊天LLM项目 | |||
GLM-4 | 清华智谱第 4 代基模型/多模态 | |||
### 大语音模型 ### | ||||
GLM-4-Voice | 智谱开源的大语音模型 | |||
ChatTTS | 语音ChatGPT | |||
### MOE架构 ### | ||||
Yuan2.0-M32 | 总参数40B激活参数3.7B,同等激活参数最强MOE架构 | |||
### 多模态大模型 ### | ||||
InternVL | 世界最强开源多模态大模型 | |||
MiniCPM-V | 世界最强开源端侧多模态大模型 - 小钢炮 | |||
Yolo v11 | Ultrlytics出品的目标检测等视觉通用框架 | |||
### 文生图/视频模型 - AIGC ### | ||||
flux | AIGC顶级框架 | |||
CogVideo | 智谱文生视频顶级框架 | |||
awesome-text-to-video | text-to-video相关资料 | |||
### 大模型微调框架 ### | ||||
swift | 阿里通义千问实验室官方出品多模态训练框架,支持35+LLM/MLM | |||
## 大模型部署+量化 ## | ||||
SGLang | 世界效率最高、最快的LLM、VLM部署框架 | |||
lmdeploy | 上海人工智能实验室出品的大模型部署框架 | |||
inference | 大模型部署、推理工具 | 0.14.1 [24-08-09] | ||
fastllm | 大模型加速/量化 | |||
### NLP基础框架 ### | ||||
transformers | 自然语言理解的基础框架 | |||
PaddleNLP | 百度通用基础NLP框架 | |||
## 大模型检索增强RAG + Agentic ## | ||||
dify | LLM app开发、RAG框架 | |||
Langchain-Chatchat | LLM Agent + RAG开发框架 | |||
RAGFlow | 顶级RAG框架 | v0.8.0 [24-07-08] | ||
MindSearch | 上海人工智能实验室出品的RAG搜索框架 | |||
Semantic Kernel | LLM apps快速开发 | |||
Awesome-Prompt-Engineering | 提示工程集合 | |||
### 量化金融 ### | ||||
hummingbot | Python语言最快的量化交易框架 | |||
### 推荐系统 ### | ||||
DeepCTR | 推荐系统顶级框架 | 0.9.2[22-10-16] |
||
### 机器学习与其他 ### | ||||
Pycaret | 顶级自动化机器学习框架 | |||
AutoX | 第四范式出品自动化机器学习框架 | |||
ProG | 图神经/图提示网络统一框架(2023 KDD Best Paper) | |||
HDLTex | 层次化文本分类 | |||
torchlm | Torch人脸/关键点系列框架 | |||
### 应用开发框架 ### | ||||
flutter | Google顶级多端iOS/Android开发框架 | |||
Total | ⭐501.74k |
因为各种各样的原因,没有被合并到主分支,但已成功被merge PR.
Company | Project | Stars | Description |
---|
| | InternVL | | 世界最强开源多模态大模型 |