elasticsearch-chikkar

This project will be merged into elasticsearch-sudachi.

A synonym token filter plugin for Elasticsearch

usage example:

suppose we use Sudachi for tokenizer.

use synonym dictionaries in text format

Pass chikkar_synonym for the type of chikkar plugin.
Set system_dict to specifiy system synonym dictionary path. The path should be relative path to the ES config folder, as ES can only access files under config folder.
Set user_dict_list with a list of user synonym dictionary paths. The paths should be relative path to the ES config folder, as ES can only access files under config folder.

{
  "settings": {
    "index": {
      "analysis": {
        "tokenizer": {
          "sudachi_tokenizer": {
            "type": "sudachi_tokenizer",
            "split_mode" : "C",
            "discard_punctuation": true,
            "resources_path": "/usr/share/elasticsearch/config"
          }
        },
        "filter" : {
            "chikkar_filter" : {
                "type" : "chikkar_synonym",
                "system_dict": "hr/hr_synonym_core.txt",
                "user_dict_list": ["hr/user_dict_1.txt", "hr/user_dict_2.txt", "hr/user_dict_3.txt"]
            }
        },
        "analyzer": {
          "sudachi_analyzer_no_synonym": {
            "filter": ["sudachi_normalizedform"],
            "tokenizer": "sudachi_tokenizer",
            "type": "custom"
          },
          "sudachi_analyzer_chikkar_synonym": {
            "filter": [
              "sudachi_normalizedform",
              "chikkar_filter"
            ],
            "tokenizer": "sudachi_tokenizer",
            "type": "custom"
          }
        }
      }
    }
  },
  "mappings": {
    "properties": {
        "content": {
            "type": "text",
            "analyzer": "sudachi_analyzer_no_synonym",
            "search_analyzer": "sudachi_analyzer_chikkar_synonym",
            "term_vector": "with_positions_offsets"
        }
    }
  }
}

Name		Name	Last commit message	Last commit date
Latest commit History 53 Commits
.formatter		.formatter
.github/workflows		.github/workflows
gradle/wrapper		gradle/wrapper
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
build.gradle		build.gradle
gradle.properties		gradle.properties
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

elasticsearch-chikkar

usage example:

use synonym dictionaries in text format

About

Releases 15

Packages

Contributors 3

Languages

License

WorksApplications/elasticsearch-chikkar

Folders and files

Latest commit

History

Repository files navigation

elasticsearch-chikkar

usage example:

use synonym dictionaries in text format

About

Resources

License

Stars

Watchers

Forks

Releases 15

Packages 0

Contributors 3

Languages

Packages