From 659e1c02ae03677de4af1711f77f2b8d0adde5f2 Mon Sep 17 00:00:00 2001
From: Hiroaki Funayama <hiroaki.funayama819@gmail.com>
Date: Sat, 29 Oct 2022 21:47:10 +0900
Subject: [PATCH 1/4] add jp translation of chapter1, 7 to 10

---
 chapters/ja/chapter1/10.mdx | 262 ++++++++++++++++++++++++++++++++++++
 chapters/ja/chapter1/7.mdx  |  23 ++++
 chapters/ja/chapter1/8.mdx  |  35 +++++
 chapters/ja/chapter1/9.mdx  |  16 +++
 4 files changed, 336 insertions(+)
 create mode 100644 chapters/ja/chapter1/10.mdx
 create mode 100644 chapters/ja/chapter1/7.mdx
 create mode 100644 chapters/ja/chapter1/8.mdx
 create mode 100644 chapters/ja/chapter1/9.mdx
diff --git a/chapters/ja/chapter1/10.mdx b/chapters/ja/chapter1/10.mdx
new file mode 100644
index 000000000..73b935508
--- /dev/null
+++ b/chapters/ja/chapter1/10.mdx
@@ -0,0 +1,262 @@
+<!-- DISABLE-FRONTMATTER-SECTIONS -->
+
+#章末クイズ
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+この章では多くの物事を学びました！詳細を把握できなくても安心してください。次の章はどのようにこれらのツールが動いているか理解する上で役に立ちます。
+
+まずは、この章で学んだことを確かめましょう！
+
+
+### 1.Hubを探索して`roberta-large-mnli`チェックポイントを見つけましょう。 このモデルはどのタスクに適していますか?
+
+<Question
+	choices={[
+		{
+			text: "文章要約",
+			explain: "もう一度roberta-large-mnliの<a href=\"https://huggingface.co/roberta-large-mnli\">ページ</a>を見てみましょう。"
+		},
+		{
+			text: "文章分類",
+			explain: "より正確には2つの文が論理的にどのような関係を持つか、３つのラベル（矛盾、中立、含意）について分類します。このタスクは<em>自然言語推論</em>とも呼ばれます。",
+			correct: true
+		},
+		{
+			text: "文章生成",
+			explain: "もう一度roberta-large-mnliの<a href=\"https://huggingface.co/roberta-large-mnli\">ページ</a>を見てみましょう。"
+		}
+	]}
+/>
+
+### 2.次のコードは何を返しますか?
+
+```py
+from transformers import pipeline
+
+ner = pipeline("ner", grouped_entities=True)
+ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")
+```
+
+<Question
+	choices={[
+		{
+            text: "この文章の分類スコアを\"positive\"または\"negative\"のラベルとともに返します。",
+            explain: "間違いです。それは<code>sentiment-analysis</code> パイプラインを用いたときの動作です。"
+		},
+		{
+            text: "この文章を完結させるための生成された文を返します。",
+            explain: "間違いです。それは <code>text-generation</code> パイプラインを用いたときの動作です。"
+		},
+		{
+            text: "この文中の人物、団体、場所を表す単語を返します。",
+            explain: "さらに、<code>grouped_entities=True</code>を用いると、同じエンティティに属する単語をグループ化します。",
+			correct: true
+		}
+	]}
+/>
+
+### 3. このサンプルコードでは...をどのように置き換えればよいでしょうか?
+
+```py
+from transformers import pipeline
+
+filler = pipeline("fill-mask", model="bert-base-cased")
+result = filler("...")
+```
+
+<Question
+	choices={[
+		{
+			text: "This \<mask\> has been waiting for you.",
+			explain: "間違いです。<code>bert-base-cased</code>のモデルカードをチェックして、あなたの間違いを見つけましょう。"
+		},
+		{
+			text: "This [MASK] has been waiting for you.",
+			explain: "正解！このモデルのマスクトークンは[MASK]です。",
+			correct: true
+		},
+		{
+			text: "This man has been waiting for you.",
+			explain: "間違いです。このパイプラインはマスクされた単語を埋めるので、どこかにマスクトークンが必要です。"
+		}
+	]}
+/>
+
+### 4. なぜこのコードは動かないのでしょうか？
+
+```py
+from transformers import pipeline
+
+classifier = pipeline("zero-shot-classification")
+result = classifier("This is a course about the Transformers library")
+```
+
+<Question
+	choices={[
+		{
+            text: "このパイプラインには、テキストを分類するためのラベルを与える必要があります。",
+            explain: "正解です。正しいコードには<code>candidate_labels=[...]</code>を含める必要があります。",
+			correct: true
+		},
+		{
+			text: "このパイプラインには、一つの文だけでなく複数の文が必要です。",
+            explain: "これは間違いです。しかし、適切に使用すれば、このパイプラインは処理する文のリストを受け取ることができます（他のパイプラインも同様です）。"
+		},
+		{
+			text: "この🤗Transformersライブラリーは壊れています、いつもどおりに。",
+            explain: "ノーコメント！"
+		},
+		{
+            text: "このパイプラインはもっと長い入力が必要です。この入力は短すぎます。",
+            explain: "これは間違いです。とても長い文をこのパイプラインで処理すると、切り捨てられることに注意してください。"
+		}
+	]}
+/>
+
+### 5. 転移学習はどのような意味ですか？
+
+
+<Question
+	choices={[
+		{
+			text: "同じデータセットで学習することで、事前学習モデルが持つ知識を新しいモデルに転移させること。",
+			explain: "違います。それは、2つのバージョンの同じモデルになります。"
+		},
+		{
+			text: "事前学習モデルの重みを用いて、2つ目の新しいモデルを初期化することで、事前学習モデルの知識を転移させること。",
+            explain: "正解です。2つ目のモデルを新しいタスクで学習する場合、それは最初のモデルが知識を*転移*したことになります。",
+			correct: true
+		},
+		{
+            text: "事前学習モデルと同じアーキテクチャを持つ新しいモデルを構築することで、事前学習モデルの知識を転移させること。",
+			explain: "アーキテクチャはあくまでもモデルの作り方であるため、この場合には知識の共有、転移は行われません。"
+		}
+	]}
+/>
+
+### 6. まるばつクイズ、言語モデルの事前学習にラベルは通常は必要ない？
+
+
+<Question
+	choices={[
+		{
+			text: "マル",
+            explain: "事前学習は通常、<em>自己教師あり学習</em>で行われます。つまり、ラベルは入力から自動的に作成されます（例えば、次の単語を予測したり、マスクされた単語を埋めたりといったように）。",
+			correct: true
+		},
+		{
+			text: "バツ",
+			explain: "これは正しい回答ではありません。"
+		}
+	]}
+/>
+
+### 7.「モデル」、「アーキテクチャ」、「重み」という用語を最も適切に説明している文を選んでください。
+
+<Question
+	choices={[
+		{
+			text: "モデルが建物であるとすれば、アーキテクチャはその設計図で、重みは中に住んでいる人です。",
+			explain: "このたとえに従うなら、重みはレンガなどビルを構成する材料になります。"
+		},
+		{
+			text: "アーキテクチャはモデルを構築するための地図であり、その重みは地図上に表される都市です。",
+			explain: "このたとえの問題は、通常地図は一つの実在する現実を表していることにあります（フランスにはパリという都市は一つしかない）。一方で、あるアーキテクチャに対して複数の重みが考えられます。"
+		},
+		{
+			text: "アーキテクチャはモデルを構築する一連の数学的な関数であり、その重みはそれらの関数のパラメータです。",
+			explain: "同じ数学的な関数の集合（アーキテクチャ）に対して、異なるパラメーター（重み）を用いることで、異なるモデルを作ることができます。",
+			correct: true
+		}
+	]}
+/>
+
+
+### 8. 生成された文でプロンプトを完成させるために使うモデルはどれでしょうか？
+
+
+<Question
+	choices={[
+		{
+			text: "encoderモデル",
+			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
+		},
+		{
+			text: "decoderモデル",
+			explain: "デコーダーモデルはプロンプトから文章を生成するために、完璧に適したモデルです。",
+			correct: true
+		},
+		{
+			text: "sequence-to-sequenceモデル",
+			explain: "Sequence-to-sequenceモデルは、与えられたプロンプトではなく入力文と関連のある文章を生成したいときにより適したモデルです。"
+		}
+	]}
+/>
+
+### 9. 文章要約タスクに使うモデルはどれでしょうか?
+
+<Question
+	choices={[
+		{
+			text: "encoderモデル",
+			explain: "encoderモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
+		},
+		{
+			text: "decoderモデル",
+			explain: "decoderモデルは出力文を生成する上で良いモデルです（要約のように）。しかし、要約する文章全体のような文脈を利用する能力はありません。"
+		},
+		{
+			text: "sequence-to-sequenceモデル",
+			explain: "Sequence-to-sequenceモデルは要約タスクに完璧に適したモデルです。",
+			correct: true
+		}
+	]}
+/>
+
+### 10. 入力された文を特定のラベルに分類したいときに使うモデルはどれでしょうか？
+
+
+<Question
+	choices={[
+		{
+			text: "encoderモデル",
+			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクに完璧に適しています。",
+			correct: true
+		},
+		{
+			text: "decoderモデル",
+			explain: "decoderモデルは出力文を生成する上で良いモデルですが、文からラベルを抽出するモデルではありません。"
+		},
+		{
+			text: "sequence-to-sequenceモデル",
+			explain: "Sequence-to-sequenceモデルは、入力文に基づいて文を生成するときにより適したモデルで、ラベルを出力するモデルではありません。",
+		}
+	]}
+/>
+
+### 11. モデルが持つバイアスはどのような要因で生じますか?
+
+
+<Question
+	choices={[
+		{
+			text: "モデルが事前学習モデルをファインチューニングしたバージョンであり、そのモデルがバイアスを元のモデルより受け継いだとき。",
+			explain: "転移学習が適用されるとき、事前学習モデルのバイアスがファインチューニングされたモデルに発現します。",
+			correct: true
+		},
+		{
+			text: "モデルを訓練するデータに偏りがある時。",
+			explain: "これは最も顕著なバイアスの要因です。しかし、要因はこれだけではありません。",
+			correct: true
+		},
+		{
+			text: "モデルを最適化するための指標に偏りがある時",
+            explain: "バイアスの要因としてあまり知られていないのはモデルの学習方法です。モデルはあなたが選んだどんな指標に対しても、やみくもに最適化します。",
+			correct: true
+		}
+	]}
+/>
diff --git a/chapters/ja/chapter1/7.mdx b/chapters/ja/chapter1/7.mdx
new file mode 100644
index 000000000..6f6221b88
--- /dev/null
+++ b/chapters/ja/chapter1/7.mdx
@@ -0,0 +1,23 @@
+# Sequence-to-sequence モデル
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+<Youtube id="0_4KEb08xrE" />
+
+Encoder-decoderモデル（*sequence-to-sequence models*とも呼ばれる）はTransformerアーキテクチャのエンコーダーとデコーダー両方を使用します。
+それぞれのステージにおいて、エンコーダーのアテンション層はもとの文のすべての単語にアクセスできるのに対して、デコーダーのアテンション層は入力中のある単語の前に位置する単語にのみアクセスできます。
+
+これらのモデルの事前学習は、エンコーダー、またはデコーダーの学習と同じように行われますが、通常はより複雑な方法を含みます。
+例えば、[T5](https://huggingface.co/t5-base) は、特殊な単語で文中のスパン（複数の単語を含むことができる）をランダムにマスクしたときに、そのマスクされた文を予測する事を目的として事前学習されています。
+
+Sequence-to-sequenceモデルは、要約、翻訳、質問応答生成などのように、与えられた入力文に対して新しい文を生成するタスクにとても適しています。
+
+これらの系統のモデルの代表は次のとおりです:
+
+- [BART](https://huggingface.co/transformers/model_doc/bart.html)
+- [mBART](https://huggingface.co/transformers/model_doc/mbart.html)
+- [Marian](https://huggingface.co/transformers/model_doc/marian.html)
+- [T5](https://huggingface.co/transformers/model_doc/t5.html)
diff --git a/chapters/ja/chapter1/8.mdx b/chapters/ja/chapter1/8.mdx
new file mode 100644
index 000000000..1b00e4416
--- /dev/null
+++ b/chapters/ja/chapter1/8.mdx
@@ -0,0 +1,35 @@
+# バイアスと限界
+
+<CourseFloatingBanner chapter={1}
+  classNames="absolute z-10 right-0 top-0"
+  notebooks={[
+    {label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter1/section8.ipynb"},
+    {label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter1/section8.ipynb"},
+]} />
+
+事前学習済みモデルやファインチューニング済みのモデルを使う場合、これらのモデルは強力なツールですが、一方で限界もあることに注意しなければなりません。
+その最たるものは、大量のデータによる事前学習を行うために研究者はインターネット上にある利用可能なデータを良いものから悪いものまで手当たりしだいに集めてしまうことです。
+
+簡単に説明するために、BERTによる`fill-mask`パイプラインの例に戻りましょう:
+
+
+```python
+from transformers import pipeline
+
+unmasker = pipeline("fill-mask", model="bert-base-uncased")
+result = unmasker("This man works as a [MASK].")
+print([r["token_str"] for r in result])
+
+result = unmasker("This woman works as a [MASK].")
+print([r["token_str"] for r in result])
+```
+
+```python out
+['lawyer', 'carpenter', 'doctor', 'waiter', 'mechanic']
+['nurse', 'waitress', 'teacher', 'maid', 'prostitute']
+```
+
+これらの２つの文の欠落した単語を埋めさせたときに、モデルはジェンダー・フリーの回答を一つだけしか与えません(waiter/waitress)。他はたいていの場合、特定の性別と関連付けられる職業です。そして、モデルは「女性」と「仕事」から連想される可能性のある職業としてトップ５に「売春婦（prostitute）」を上げています。
+BERTはインターネット上のあらゆるところからデータをかき集めて構築されたのではなく、中立的なデータ([English Wikipedia](https://huggingface.co/datasets/wikipedia)と[BookCorpus](https://huggingface.co/datasets/bookcorpus)を用いて学習されています) を用いて構築されためずらしいTransformerモデルであるにも関わらず、このような現象が発生してしまいます。
+
+したがって、これらのツールを使用する際は、これらのオリジナルのモデルがとても簡単に性的、差別的、あるいは同性愛嫌悪のコンテンツを生成してしまうことを念頭に置く必要があります。この本質的なバイアスは、あるデータでファインチューニングしても消えることはありません。
\ No newline at end of file
diff --git a/chapters/ja/chapter1/9.mdx b/chapters/ja/chapter1/9.mdx
new file mode 100644
index 000000000..c38df4be3
--- /dev/null
+++ b/chapters/ja/chapter1/9.mdx
@@ -0,0 +1,16 @@
+# まとめ
+
+<CourseFloatingBanner
+    chapter={1}
+    classNames="absolute z-10 right-0 top-0"
+/>
+
+この章では、🤗 Transformersが提供する高レベルな`pipeline()` 関数を用いて、異なるNLPタスクにアプローチする方法を学びました。また、同様にHub用いてモデルを探す方法や、推論APIを使ってブラウザ上でモデルを直接テストする方法も学びました。
+
+私たちはTransformerモデルがどのように動作するかを高いレベルで議論し、さらに転移学習やファインチューニングの重要性について話しました。一つの重要な観点は、解きたいタスクに応じてアーキテクチャ全体を用いることや、エンコーダーやデコーダの一方だけを用いることもできるという点です。以下の表はそのまとめです。
+
+| モデル           | 例                                          | タスク                                                                            |
+|-----------------|--------------------------------------------|----------------------------------------------------------------------------------|
+| Encoder         | ALBERT, BERT, DistilBERT, ELECTRA, RoBERTa |文章分類, 固有表現抽出, 抽出型質問応答                                                  |
+| Decoder         | CTRL, GPT, GPT-2, Transformer XL           | 文章生成                                                                          |
+| Encoder-decoder | BART, T5, Marian, mBART                    | 文章要約, 翻訳, 生成型質問応答　                                                      |

From c2e8b9769b24dc3171d06762212779efcff06e16 Mon Sep 17 00:00:00 2001
From: Hiroaki Funayama <hiroaki.funayama819@gmail.com>
Date: Sat, 29 Oct 2022 22:10:58 +0900
Subject: [PATCH 2/4] modify ja chapter1 10.mdx

---
 chapters/ja/_toctree.yml    | 8 ++++++++
 chapters/ja/chapter1/10.mdx | 2 +-
 2 files changed, 9 insertions(+), 1 deletion(-)

diff --git a/chapters/ja/_toctree.yml b/chapters/ja/_toctree.yml
index c1d0fcd7f..3d2e0342f 100644
--- a/chapters/ja/_toctree.yml
+++ b/chapters/ja/_toctree.yml
@@ -7,6 +7,14 @@
   sections:
   - local: chapter1/1
     title: イントロダクション
+  - local: chapter1/7
+    title: Sequence-to-sequence モデル
+  - local: chapter1/8
+    title: バイアスと限界
+  - local: chapter1/9
+    title: まとめ
+  - local: chapter1/10
+    title: 章末クイズ
 
 - title: 4. モデルとトークナイザーの共有
   sections:
diff --git a/chapters/ja/chapter1/10.mdx b/chapters/ja/chapter1/10.mdx
index 73b935508..401e3e59a 100644
--- a/chapters/ja/chapter1/10.mdx
+++ b/chapters/ja/chapter1/10.mdx
@@ -1,6 +1,6 @@
 <!-- DISABLE-FRONTMATTER-SECTIONS -->
 
-#章末クイズ
+# 章末クイズ
 
 <CourseFloatingBanner
     chapter={1}

From 42ddb535a3015e6d56cae670027bf90de7887b85 Mon Sep 17 00:00:00 2001
From: Hiroaki Funayama <hiroaki.funayama819@gmail.com>
Date: Sun, 30 Oct 2022 14:59:59 +0900
Subject: [PATCH 3/4] modify 7.mdx, 8.mdx, 8.mdx, 10.mdx

---
 chapters/ja/chapter1/10.mdx | 22 +++++++++++-----------
 chapters/ja/chapter1/7.mdx  |  4 ++--
 chapters/ja/chapter1/8.mdx  |  4 ++--
 chapters/ja/chapter1/9.mdx  |  4 ++--
 4 files changed, 17 insertions(+), 17 deletions(-)

diff --git a/chapters/ja/chapter1/10.mdx b/chapters/ja/chapter1/10.mdx
index 401e3e59a..a83afe156 100644
--- a/chapters/ja/chapter1/10.mdx
+++ b/chapters/ja/chapter1/10.mdx
@@ -107,24 +107,24 @@ result = classifier("This is a course about the Transformers library")
             explain: "これは間違いです。しかし、適切に使用すれば、このパイプラインは処理する文のリストを受け取ることができます（他のパイプラインも同様です）。"
 		},
 		{
-			text: "この🤗Transformersライブラリーは壊れています、いつもどおりに。",
+			text: "いつもどおり、この🤗Transformersライブラリーは壊れています。",
             explain: "ノーコメント！"
 		},
 		{
             text: "このパイプラインはもっと長い入力が必要です。この入力は短すぎます。",
-            explain: "これは間違いです。とても長い文をこのパイプラインで処理すると、切り捨てられることに注意してください。"
+            explain: "これは間違いです。ただし、とても長い文をこのパイプラインで処理すると、切り捨てられることに注意してください。"
 		}
 	]}
 />
 
-### 5. 転移学習はどのような意味ですか？
+### 5. 転移学習とはどのような意味ですか？
 
 
 <Question
 	choices={[
 		{
 			text: "同じデータセットで学習することで、事前学習モデルが持つ知識を新しいモデルに転移させること。",
-			explain: "違います。それは、2つのバージョンの同じモデルになります。"
+			explain: "間違いです。それは、2つのバージョンの同じモデルになります。"
 		},
 		{
 			text: "事前学習モデルの重みを用いて、2つ目の新しいモデルを初期化することで、事前学習モデルの知識を転移させること。",
@@ -165,10 +165,10 @@ result = classifier("This is a course about the Transformers library")
 		},
 		{
 			text: "アーキテクチャはモデルを構築するための地図であり、その重みは地図上に表される都市です。",
-			explain: "このたとえの問題は、通常地図は一つの実在する現実を表していることにあります（フランスにはパリという都市は一つしかない）。一方で、あるアーキテクチャに対して複数の重みが考えられます。"
+			explain: "このたとえの問題は、通常地図は一つの実在する現実を表していることにあります（フランスにはパリという都市は一つしかない）。一方で、あるアーキテクチャに対して複数の重みを考えることができます。"
 		},
 		{
-			text: "アーキテクチャはモデルを構築する一連の数学的な関数であり、その重みはそれらの関数のパラメータです。",
+			text: "アーキテクチャはモデルを構築する一連の数学的な関数であり、重みはそれらの関数のパラメータです。",
 			explain: "同じ数学的な関数の集合（アーキテクチャ）に対して、異なるパラメーター（重み）を用いることで、異なるモデルを作ることができます。",
 			correct: true
 		}
@@ -183,11 +183,11 @@ result = classifier("This is a course about the Transformers library")
 	choices={[
 		{
 			text: "encoderモデル",
-			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
+			explain: "encoderモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
 		},
 		{
 			text: "decoderモデル",
-			explain: "デコーダーモデルはプロンプトから文章を生成するために、完璧に適したモデルです。",
+			explain: "decoderモデルはプロンプトから文章を生成するために、完璧に適したモデルです。",
 			correct: true
 		},
 		{
@@ -207,7 +207,7 @@ result = classifier("This is a course about the Transformers library")
 		},
 		{
 			text: "decoderモデル",
-			explain: "decoderモデルは出力文を生成する上で良いモデルです（要約のように）。しかし、要約する文章全体のような文脈を利用する能力はありません。"
+			explain: "decoderモデルは出力文を生成する上で良いモデルです（たとえば要約のように）。しかし、要約対象の文章全体のような文脈を利用する能力はありません。"
 		},
 		{
 			text: "sequence-to-sequenceモデル",
@@ -224,7 +224,7 @@ result = classifier("This is a course about the Transformers library")
 	choices={[
 		{
 			text: "encoderモデル",
-			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクに完璧に適しています。",
+			explain: "encoderモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクに完璧に適しています。",
 			correct: true
 		},
 		{
@@ -244,7 +244,7 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "モデルが事前学習モデルをファインチューニングしたバージョンであり、そのモデルがバイアスを元のモデルより受け継いだとき。",
+			text: "モデルが事前学習モデルをファインチューニングしたバージョンであり、そのモデルが元のモデルよりバイアスを受け継いだとき。",
 			explain: "転移学習が適用されるとき、事前学習モデルのバイアスがファインチューニングされたモデルに発現します。",
 			correct: true
 		},
diff --git a/chapters/ja/chapter1/7.mdx b/chapters/ja/chapter1/7.mdx
index 6f6221b88..e4bf8ea27 100644
--- a/chapters/ja/chapter1/7.mdx
+++ b/chapters/ja/chapter1/7.mdx
@@ -7,8 +7,8 @@
 
 <Youtube id="0_4KEb08xrE" />
 
-Encoder-decoderモデル（*sequence-to-sequence models*とも呼ばれる）はTransformerアーキテクチャのエンコーダーとデコーダー両方を使用します。
-それぞれのステージにおいて、エンコーダーのアテンション層はもとの文のすべての単語にアクセスできるのに対して、デコーダーのアテンション層は入力中のある単語の前に位置する単語にのみアクセスできます。
+Encoder-decoderモデル（*sequence-to-sequence models*とも呼ばれる）はTransformerアーキテクチャのエンコーダーとデコーダーの両方を使用します。
+それぞれのステージにおいて、エンコーダーのアテンション層は入力文のすべての単語にアクセスできるのに対して、デコーダーのアテンション層は入力中のある単語の前に位置する単語にのみアクセスできます。
 
 これらのモデルの事前学習は、エンコーダー、またはデコーダーの学習と同じように行われますが、通常はより複雑な方法を含みます。
 例えば、[T5](https://huggingface.co/t5-base) は、特殊な単語で文中のスパン（複数の単語を含むことができる）をランダムにマスクしたときに、そのマスクされた文を予測する事を目的として事前学習されています。
diff --git a/chapters/ja/chapter1/8.mdx b/chapters/ja/chapter1/8.mdx
index 1b00e4416..f8bef2770 100644
--- a/chapters/ja/chapter1/8.mdx
+++ b/chapters/ja/chapter1/8.mdx
@@ -8,7 +8,7 @@
 ]} />
 
 事前学習済みモデルやファインチューニング済みのモデルを使う場合、これらのモデルは強力なツールですが、一方で限界もあることに注意しなければなりません。
-その最たるものは、大量のデータによる事前学習を行うために研究者はインターネット上にある利用可能なデータを良いものから悪いものまで手当たりしだいに集めてしまうことです。
+その代表例は、大量のデータによる事前学習を行うために、研究者はインターネット上にある利用可能なデータを良いものから悪いものまで手当たりしだいに集めてしまうことです。
 
 簡単に説明するために、BERTによる`fill-mask`パイプラインの例に戻りましょう:
 
@@ -32,4 +32,4 @@ print([r["token_str"] for r in result])
 これらの２つの文の欠落した単語を埋めさせたときに、モデルはジェンダー・フリーの回答を一つだけしか与えません(waiter/waitress)。他はたいていの場合、特定の性別と関連付けられる職業です。そして、モデルは「女性」と「仕事」から連想される可能性のある職業としてトップ５に「売春婦（prostitute）」を上げています。
 BERTはインターネット上のあらゆるところからデータをかき集めて構築されたのではなく、中立的なデータ([English Wikipedia](https://huggingface.co/datasets/wikipedia)と[BookCorpus](https://huggingface.co/datasets/bookcorpus)を用いて学習されています) を用いて構築されためずらしいTransformerモデルであるにも関わらず、このような現象が発生してしまいます。
 
-したがって、これらのツールを使用する際は、これらのオリジナルのモデルがとても簡単に性的、差別的、あるいは同性愛嫌悪のコンテンツを生成してしまうことを念頭に置く必要があります。この本質的なバイアスは、あるデータでファインチューニングしても消えることはありません。
\ No newline at end of file
+したがって、これらのツールを使用する際は、オリジナルのモデルがとても簡単に性的、差別的、あるいは同性愛嫌悪のコンテンツを生成してしまうことを念頭に置く必要があります。この本質的なバイアスは、あるデータでファインチューニングしても消えることはありません。
\ No newline at end of file
diff --git a/chapters/ja/chapter1/9.mdx b/chapters/ja/chapter1/9.mdx
index c38df4be3..7e7a9054b 100644
--- a/chapters/ja/chapter1/9.mdx
+++ b/chapters/ja/chapter1/9.mdx
@@ -5,9 +5,9 @@
     classNames="absolute z-10 right-0 top-0"
 />
 
-この章では、🤗 Transformersが提供する高レベルな`pipeline()` 関数を用いて、異なるNLPタスクにアプローチする方法を学びました。また、同様にHub用いてモデルを探す方法や、推論APIを使ってブラウザ上でモデルを直接テストする方法も学びました。
+この章では、🤗 Transformersが提供する高レベルな`pipeline()` 関数を用いて、異なるNLPタスクにアプローチする方法を学びました。また、同様にHubを用いてモデルを探す方法や、推論APIを使ってブラウザ上でモデルを直接テストする方法も学びました。
 
-私たちはTransformerモデルがどのように動作するかを高いレベルで議論し、さらに転移学習やファインチューニングの重要性について話しました。一つの重要な観点は、解きたいタスクに応じてアーキテクチャ全体を用いることや、エンコーダーやデコーダの一方だけを用いることもできるという点です。以下の表はそのまとめです。
+私たちはTransformerモデルがどのように動作するかを高いレベルで議論し、さらに転移学習やファインチューニングの重要性について話しました。一つの重要な観点は、解きたいタスクに応じてアーキテクチャ全体を用いることや、エンコーダーやデコーダの一方だけを用いることができるという点です。以下の表はそのまとめです。
 
 | モデル           | 例                                          | タスク                                                                            |
 |-----------------|--------------------------------------------|----------------------------------------------------------------------------------|

From 41e739a3be15e073ed78ff4dcf331b466c998fd0 Mon Sep 17 00:00:00 2001
From: Hiroaki Funayama <hiroaki.funayama819@gmail.com>
Date: Thu, 3 Nov 2022 17:12:54 +0900
Subject: [PATCH 4/4] slightly modified

---
 chapters/ja/chapter1/10.mdx | 28 ++++++++++++++--------------
 chapters/ja/chapter1/8.mdx  |  2 +-
 chapters/ja/chapter1/9.mdx  |  2 +-
 3 files changed, 16 insertions(+), 16 deletions(-)

diff --git a/chapters/ja/chapter1/10.mdx b/chapters/ja/chapter1/10.mdx
index a83afe156..11b70518a 100644
--- a/chapters/ja/chapter1/10.mdx
+++ b/chapters/ja/chapter1/10.mdx
@@ -107,7 +107,7 @@ result = classifier("This is a course about the Transformers library")
             explain: "これは間違いです。しかし、適切に使用すれば、このパイプラインは処理する文のリストを受け取ることができます（他のパイプラインも同様です）。"
 		},
 		{
-			text: "いつもどおり、この🤗Transformersライブラリーは壊れています。",
+			text: "いつもどおり、この🤗Transformersライブラリは壊れています。",
             explain: "ノーコメント！"
 		},
 		{
@@ -138,7 +138,7 @@ result = classifier("This is a course about the Transformers library")
 	]}
 />
 
-### 6. まるばつクイズ、言語モデルの事前学習にラベルは通常は必要ない？
+### 6. マルバツクイズ、言語モデルの事前学習にラベルは通常は必要ない？
 
 
 <Question
@@ -182,12 +182,12 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "encoderモデル",
-			explain: "encoderモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
+			text: "エンコーダーモデル",
+			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
 		},
 		{
-			text: "decoderモデル",
-			explain: "decoderモデルはプロンプトから文章を生成するために、完璧に適したモデルです。",
+			text: "デコーダーモデル",
+			explain: "デコーダーモデルはプロンプトから文章を生成するために、完璧に適したモデルです。",
 			correct: true
 		},
 		{
@@ -202,12 +202,12 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "encoderモデル",
-			explain: "encoderモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
+			text: "エンコーダーモデル",
+			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクにより適しています。"
 		},
 		{
-			text: "decoderモデル",
-			explain: "decoderモデルは出力文を生成する上で良いモデルです（たとえば要約のように）。しかし、要約対象の文章全体のような文脈を利用する能力はありません。"
+			text: "デコーダーモデル",
+			explain: "デコーダーモデルは出力文を生成する上で良いモデルです（たとえば要約のように）。しかし、要約対象の文章全体のような文脈を利用する能力はありません。"
 		},
 		{
 			text: "sequence-to-sequenceモデル",
@@ -223,13 +223,13 @@ result = classifier("This is a course about the Transformers library")
 <Question
 	choices={[
 		{
-			text: "encoderモデル",
-			explain: "encoderモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクに完璧に適しています。",
+			text: "エンコーダーモデル",
+			explain: "エンコーダーモデルは文章全体の埋め込み表現を生成するので、文章分類のようなタスクに完璧に適しています。",
 			correct: true
 		},
 		{
-			text: "decoderモデル",
-			explain: "decoderモデルは出力文を生成する上で良いモデルですが、文からラベルを抽出するモデルではありません。"
+			text: "デコーダーモデル",
+			explain: "デコーダーモデルは出力文を生成する上で良いモデルですが、文からラベルを抽出するモデルではありません。"
 		},
 		{
 			text: "sequence-to-sequenceモデル",
diff --git a/chapters/ja/chapter1/8.mdx b/chapters/ja/chapter1/8.mdx
index f8bef2770..e81b75dc4 100644
--- a/chapters/ja/chapter1/8.mdx
+++ b/chapters/ja/chapter1/8.mdx
@@ -29,7 +29,7 @@ print([r["token_str"] for r in result])
 ['nurse', 'waitress', 'teacher', 'maid', 'prostitute']
 ```
 
-これらの２つの文の欠落した単語を埋めさせたときに、モデルはジェンダー・フリーの回答を一つだけしか与えません(waiter/waitress)。他はたいていの場合、特定の性別と関連付けられる職業です。そして、モデルは「女性」と「仕事」から連想される可能性のある職業としてトップ５に「売春婦（prostitute）」を上げています。
+これらの２つの文の欠落した単語を埋めさせたときに、モデルはジェンダーフリーの回答を一つだけしか与えません(waiter/waitress)。他はたいていの場合、特定の性別と関連付けられる職業です。そして、モデルは「女性」と「仕事」から連想される可能性のある職業としてトップ５に「売春婦（prostitute）」を上げています。
 BERTはインターネット上のあらゆるところからデータをかき集めて構築されたのではなく、中立的なデータ([English Wikipedia](https://huggingface.co/datasets/wikipedia)と[BookCorpus](https://huggingface.co/datasets/bookcorpus)を用いて学習されています) を用いて構築されためずらしいTransformerモデルであるにも関わらず、このような現象が発生してしまいます。
 
 したがって、これらのツールを使用する際は、オリジナルのモデルがとても簡単に性的、差別的、あるいは同性愛嫌悪のコンテンツを生成してしまうことを念頭に置く必要があります。この本質的なバイアスは、あるデータでファインチューニングしても消えることはありません。
\ No newline at end of file
diff --git a/chapters/ja/chapter1/9.mdx b/chapters/ja/chapter1/9.mdx
index 7e7a9054b..4299784d1 100644
--- a/chapters/ja/chapter1/9.mdx
+++ b/chapters/ja/chapter1/9.mdx
@@ -7,7 +7,7 @@
 
 この章では、🤗 Transformersが提供する高レベルな`pipeline()` 関数を用いて、異なるNLPタスクにアプローチする方法を学びました。また、同様にHubを用いてモデルを探す方法や、推論APIを使ってブラウザ上でモデルを直接テストする方法も学びました。
 
-私たちはTransformerモデルがどのように動作するかを高いレベルで議論し、さらに転移学習やファインチューニングの重要性について話しました。一つの重要な観点は、解きたいタスクに応じてアーキテクチャ全体を用いることや、エンコーダーやデコーダの一方だけを用いることができるという点です。以下の表はそのまとめです。
+さらに、Transformerモデルがどのように動作するかを高いレベルで議論し、さらに転移学習やファインチューニングの重要性について話しました。一つの重要な観点は、解きたいタスクに応じてアーキテクチャ全体を用いることや、エンコーダーやデコーダーの一方だけを用いることができるという点です。以下の表はそのまとめです。
 
 | モデル           | 例                                          | タスク                                                                            |
 |-----------------|--------------------------------------------|----------------------------------------------------------------------------------|