A Vietnamese word segmentation tool.
- DongDu là phần mềm tách từ dành cho tiếng Việt.
- Được viết trên ngôn ngữ C++, bởi Lưu Tuấn Anh dưới sự hướng dẫn của Yamamoto Kazuhide.
- DongDu đạt được độ chính xác rất cao (>98%), nhanh và sử dụng ít RAM hơn so với những phần mềm khác.
- DongDu bao gồm cả chương trình tách từ (predictor) và chương trình học máy (learner). Người dùng có thể tự tạo ra dữ liệu cho cá nhân một cách đơn giản.
- Bài viết về thuật toán và phương pháp cụ thể có thể download ở đây (bản tiếng Việt).
- Mọi liên hệ, góp ý hay báo lỗi của chương trình, xin gửi về địa chỉ : [email protected]