この記事で紹介されている通り、ChatGPTのTokenizerは日本語ではイケていない。 そのため、日本語でプロンプトを書くと、ChatGPTがプロンプトに従わないことがよくある。 そこで、プロンプトで日本語を書く際に、気を付けるべきことをまとめた。
日本語でプロンプトを指定すると、文字数制限(例:50文字以内で答えて下さい、200文字以上300文字以下で答えて下さい)は効かない。 背景で紹介した記事を見れば分かる通り、ChatGPTが内部で日本語の文字を識別できないためだと考えられる。
解決策としては、例えば、短く答えて欲しい場合は「簡潔に」という文言を入れる、また文の数を指定するという方法がある。 文字数の指定と比較して、文の数の指定は効く場合が多い。
# Bad
- 50文字以内で答えて下さい、
# Better
- 簡潔に答えて下さい。
- 3文以内で答えて下さい。