カタカナの改行位置が不正 #5

k-takata · 2016-11-24T12:51:27Z

以下のファイルに対し、tw=68 に設定し、2～6行目を1行ずつ整形してみます。(github上で見ると崩れていますが…。)

----+----1----+----2----+----3----+----4----+----5----+----6----+---|7||||+
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォーマット
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォーマト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フーマト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォマト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１　フォマト

実行例:

vim -N -u NONE -U NONE --cmd "set rtp^=<autofmt-dir> tw=68" --cmd "set formatexpr=autofmt#japanese#formatexpr()" test.txt

jgqq を 5 回実行。

期待値:

----+----1----+----2----+----3----+----4----+----5----+----6----+---|7||||+
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォー
マット
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォー
マト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フーマ
ト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォマ
ト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１　フォ
マト

実際:

----+----1----+----2----+----3----+----4----+----5----+----6----+---|7||||+
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１
フォーマット
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１
フォーマト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フーマ
ト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１フォマ
ト
１２３４５６７８９０１２３４５６７８９０１２３４５６７８９０１　
フォマト

どうも、長音記号や拗音の後で改行してくれないようです。

The text was updated successfully, but these errors were encountered:

k-takata · 2016-11-24T12:58:37Z

原因ですが、Unicode 7.0対応のときの不備ではないかと思います。
Unicode 6.1で、UAX #14が改定された際に、CJ (Conditional Japanese Starter)というプロパティーが追加されたのですが、それに対する処理が抜けているように思われます。
CJは、strictな処理の場合はNSと同様に扱い、normalな処理の場合はIDと同様に扱う文字のようです。

Treat as NS or ID for strict or normal breaking.

W3C の https://www.w3.org/TR/jlreq/ja/ によると、

3.9.2 文字・記号を振る舞い方により分ける

10. 長音記号（cl-10）
注2） JIS X 4051では，処理系定義として，長音記号[ー] (KATAKANA-HIRAGANA
PROLONGED SOUND MARK)を行頭禁則和字から除くことは認められている．

11. 小書きの仮名（cl-11）
注2） JIS X 4051では，処理系定義として，小書きの仮名（ぁぃぅァィゥなど）を行頭
禁則和字から除くことは認められている．

ということで、長音記号や拗音を、禁則処理の対象とするかどうかを選択できるようにするための処置のようです。
autofmtも、処理を選択できるようにしたほうが良いかもしれません。(現行はstrict相当のはず。)

* Support `CJ` property which was introduced with Unicode 6.1. * Support `autofmt_strict_japanese_linebreak` setting.

k-takata · 2016-11-24T23:29:52Z

Fixed. Closing.

koron · 2016-11-25T00:40:17Z

ありがとうございます!

koron · 2016-11-25T00:41:45Z

対応するテストって、ありました?

k-takata · 2016-11-25T01:21:11Z

test3が日本語関連のテストですが、長音記号・拗音関連のテストはなかったですね。
あと、autofmt_allow_over_tw, autofmt_allow_over_tw_char と、今回追加した autofmt_strict_japanese_linebreak 関連のテストもありません。

k-takata mentioned this issue Nov 24, 2016

Translate untranslated sentences in repeat.jax vim-jp/vimdoc-ja-working#52

Merged

k-takata added a commit that referenced this issue Nov 24, 2016

Fix for Issue #5

e81aab2

* Support `CJ` property which was introduced with Unicode 6.1. * Support `autofmt_strict_japanese_linebreak` setting.

k-takata mentioned this issue Nov 24, 2016

Fix katakana linebreak #6

Merged

k-takata closed this as completed Nov 24, 2016

koron mentioned this issue Nov 26, 2016

テストを追加 #10

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

カタカナの改行位置が不正 #5

カタカナの改行位置が不正 #5

k-takata commented Nov 24, 2016

k-takata commented Nov 24, 2016 •

edited

Loading

Uh oh!

k-takata commented Nov 24, 2016

Uh oh!

koron commented Nov 25, 2016

Uh oh!

koron commented Nov 25, 2016

Uh oh!

k-takata commented Nov 25, 2016

Uh oh!

カタカナの改行位置が不正 #5

カタカナの改行位置が不正 #5

Comments

k-takata commented Nov 24, 2016

k-takata commented Nov 24, 2016 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

k-takata commented Nov 24, 2016

Uh oh!

koron commented Nov 25, 2016

Uh oh!

koron commented Nov 25, 2016

Uh oh!

k-takata commented Nov 25, 2016

Uh oh!

k-takata commented Nov 24, 2016 •

edited

Loading