InternEvo

InternEvo ^HOT

👋 Discord と WeChat で私たちに参加してください

イントロダクション

InternEvoは、広範な依存関係を必要とせずにモデルの事前トレーニングをサポートすることを目的としたオープンソースの軽量トレーニングフレームワークです。単一のコードベースで、数千のGPUを搭載した大規模クラスターでの事前トレーニングと、単一GPUでのファインチューニングをサポートし、顕著なパフォーマンス最適化を実現しています。InternEvoは、1024個のGPUでのトレーニング中に約90%の加速効率を達成しています。

InternEvoトレーニングフレームワークを基に、当社はInternLM-7BシリーズやInternLM-20Bシリーズを含むさまざまな大規模言語モデルを継続的にリリースしています。これらのモデルは、LLaMAのような数多くの有名なオープンソースの大規模言語モデルや、その他の業界をリードするモデルを大きく上回る性能を発揮しています。

クイックスタート

InternEvoのインストール、データ処理、事前トレーニング、およびファインチューニングを開始するためには、使用チュートリアルを参照してください。

詳細については、以下をご確認ください: internevo.readthedocs.io

システムアーキテクチャ

アーキテクチャの詳細については、システムアーキテクチャドキュメントを参照してください。

トレーニングパフォーマンス

InternEvoは、Flash-Attention、Apexなどの高性能モデルオペレーターを深く統合してトレーニング効率を向上させています。Hybrid Zeroテクニックを構築することにより、計算と通信の効率的な重複を実現し、トレーニング中のクロスノード通信トラフィックを大幅に削減します。InternEvoは、7Bモデルを8つのGPUから1024個のGPUに拡張することをサポートし、千のGPUスケールで最大90%の加速効率、180 TFLOPSを超えるトレーニングスループット、そしてGPUあたり秒間3600トークン以上の平均を実現します。以下の表は、異なる構成でのInternEvoのスケーラビリティテストデータを示しています：

GPU 番号	8	16	32	64	128	256	512	1024
TGS	4078	3939	3919	3944	3928	3920	3835	3625
TFLOPS	193	191	188	188	187	185	186	184

TGSは、GPUごとの秒間平均処理トークン数を表しています。より多くのパフォーマンステストデータについては、トレーニングパフォーマンスドキュメントをご参照ください。

コントリビュート

我々は、InternEvo を改善し、向上させるために尽力してくれたすべての貢献者に感謝している。コミュニティ・ユーザーのプロジェクトへの参加が強く推奨されます。プロジェクトへの貢献方法については、貢献ガイドラインを参照してください。

謝辞

InternEvo コードベースは、上海 AI 研究所と様々な大学や企業の研究者によって貢献されたオープンソースプロジェクトです。プロジェクトに新機能を追加してくれたすべての貢献者と、貴重なフィードバックを提供してくれたユーザーに感謝したい。私たちは、このツールキットとベンチマークが、InternLM をファインチューニングし、独自のモデルを開発するための柔軟で効率的なコードツールをコミュニティに提供し、オープンソースコミュニティに継続的に貢献できることを願っています。2 つのオープンソースプロジェクト、flash-attention と ColossalAI に感謝します。

引用

@misc{2023internlm,
    title={InternLM: A Multilingual Language Model with Progressively Enhanced Capabilities},
    author={InternLM Team},
    howpublished = {\url{https://github.com/InternLM/InternLM}},
    year={2023}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README-ja-JP.md

README-ja-JP.md

InternEvo

最新ニュース 🔥

イントロダクション

クイックスタート

システムアーキテクチャ

トレーニングパフォーマンス

コントリビュート

謝辞

引用

Files

README-ja-JP.md

Latest commit

History

README-ja-JP.md

File metadata and controls

InternEvo

最新ニュース 🔥

イントロダクション

クイックスタート

システムアーキテクチャ

トレーニングパフォーマンス

コントリビュート

謝辞

引用