-
Notifications
You must be signed in to change notification settings - Fork 0
/
za_stopwords.main.jsonl
86 lines (86 loc) · 10.7 KB
/
za_stopwords.main.jsonl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
{"eng": "a", "zul": "a", "xho": "a", "sot": "a", "nso": "a", "tsn": "a", "ven": "a", "tso": "a"}
{"eng": "about", "zul": "mayelana", "xho": "malunga", "sot": "ka", "nso": "ka", "tsn": "ka", "ven": "nga", "tso": "hi"}
{"eng": "after", "zul": "ngemuva", "xho": "emva", "sot": "ka mor'a", "nso": "ka morago ga", "tsn": "ka morago ga", "ven": "nga murahu ha", "tso": "endzhaku ka"}
{"eng": "all", "zul": "konke", "xho": "zonke", "sot": "kaofela", "nso": "ka moka", "tsn": "ka gotlhe", "ven": "zwoṱhe", "tso": "hinkwaswo"}
{"eng": "also", "zul": "futhi", "xho": "kwakhona", "sot": "hape", "nso": "gape", "tsn": "gape", "ven": "nga vha", "tso": "nakambe"}
{"eng": "and", "zul": "futhi", "xho": "kunye", "sot": "le", "nso": "le", "tsn": "le", "ven": "na", "tso": "na"}
{"eng": "any", "zul": "noma iyiphi", "xho": "nawuphi", "sot": "feela", "nso": "feela", "tsn": "fela", "ven": "ne", "tso": "hambi yin'wana"}
{"eng": "as", "zul": "njenge", "xho": "njenge", "sot": "joalo ka", "nso": "bjalo ka", "tsn": "jaaka", "ven": "sa", "tso": "tanihi"}
{"eng": "at", "zul": "e", "xho": "e", "sot": "ho", "nso": "go", "tsn": "kwa", "ven": "kha", "tso": "eka"}
{"eng": "be", "zul": "uba", "xho": "kuba", "sot": "ho ba", "nso": "go ba", "tsn": "go nna", "ven": "vhudi", "tso": "kuva"}
{"eng": "because", "zul": "ngoba", "xho": "kuba", "sot": "hobane", "nso": "ka lebaka la", "tsn": "ka ntlha ya", "ven": "ngauri", "tso": "hikuva"}
{"eng": "been", "zul": "uye", "xho": "ube", "sot": "bileng", "nso": "e bile", "tsn": "e bile", "ven": "ho vha", "tso": "ku ve"}
{"eng": "but", "zul": "kodwa", "xho": "kodwa", "sot": "empa", "nso": "efela", "tsn": "mme", "ven": "fhedzi", "tso": "kambe"}
{"eng": "by", "zul": "ngo", "xho": "ngo", "sot": "ke", "nso": "ke", "tsn": "ke", "ven": "nga", "tso": "hi"}
{"eng": "can", "zul": "kungaba", "xho": "ingakwazi", "sot": "ka kgona", "nso": "ka kgona", "tsn": "ka kgona", "ven": "nga kona", "tso": "ku kota"}
{"eng": "come", "zul": "fika", "xho": "iza", "sot": "tla", "nso": "tla", "tsn": "tla", "ven": "vhafha", "tso": "ta"}
{"eng": "could", "zul": "kungenzeka", "xho": "ngenxa", "sot": "ka kgona", "nso": "ka kgona", "tsn": "ka kgona", "ven": "nga kona", "tso": "kota"}
{"eng": "do", "zul": "enza", "xho": "enza", "sot": "etsa", "nso": "dira", "tsn": "dirang", "ven": "ita", "tso": "endla"}
{"eng": "each", "zul": "ngalinye", "xho": "ngalunye", "sot": "ngoe le e ngoe", "nso": "nngwe le nngwe", "tsn": "nngwe le nngwe", "ven": "nga lutambo", "tso": "xin'wana na xin'wana"}
{"eng": "even", "zul": "ngisho", "xho": "nokuba", "sot": "le", "nso": "le", "tsn": "le", "ven": "vhona", "tso": "hambi"}
{"eng": "for", "zul": "nge", "xho": "ngenxa", "sot": "bakeng sa", "nso": "bakeng sa", "tsn": "bakeng sa", "ven": "kha", "tso": "ka"}
{"eng": "from", "zul": "kusuka", "xho": "ukusuka", "sot": "ho tloha", "nso": "go tswa", "tsn": "go tswa", "ven": "kha", "tso": "ku suka"}
{"eng": "get", "zul": "thola", "xho": "fumana", "sot": "fumana", "nso": "fumana", "tsn": "fumana", "ven": "wana", "tso": "kuma"}
{"eng": "got", "zul": "wathola", "xho": "ufumene", "sot": "fumane", "nso": "fumane", "tsn": "fumane", "ven": "wana", "tso": "ku kuma"}
{"eng": "had", "zul": "wathola", "xho": "wane", "sot": "ne a na", "nso": "ne a na", "tsn": "ne a na", "ven": "o vha o na", "tso": "a ri na"}
{"eng": "has", "zul": "une", "xho": "una", "sot": "na le", "nso": "na le", "tsn": "na le", "ven": "na", "tso": "na"}
{"eng": "have", "zul": "babe", "xho": "babe", "sot": "na le", "nso": "na le", "tsn": "na le", "ven": "na", "tso": "na"}
{"eng": "he", "zul": "yena", "xho": "yena", "sot": "yena", "nso": "yena", "tsn": "yena", "ven": "ene", "tso": "yena"}
{"eng": "her", "zul": "yena", "xho": "yena", "sot": "yena", "nso": "yena", "tsn": "yena", "ven": "e", "tso": "yena"}
{"eng": "him", "zul": "yena", "xho": "yena", "sot": "yena", "nso": "yena", "tsn": "yena", "ven": "e", "tso": "yena"}
{"eng": "his", "zul": "yakhe", "xho": "yakhe", "sot": "ya hae", "nso": "ya gagwe", "tsn": "ya gagwe", "ven": "yawe", "tso": "yakwe"}
{"eng": "how", "zul": "kakhulu", "xho": "kanjani", "sot": "joang", "nso": "bjang", "tsn": "jaang", "ven": "ndi", "tso": "ku endla"}
{"eng": "if", "zul": "uma", "xho": "ukuba", "sot": "haeba", "nso": "ge", "tsn": "fa", "ven": "arali", "tso": "loko"}
{"eng": "in", "zul": "ku", "xho": "ku", "sot": "ka", "nso": "ka", "tsn": "mo", "ven": "khavho", "tso": "eka"}
{"eng": "into", "zul": "ku", "xho": "ku", "sot": "ka hare", "nso": "ka gare", "tsn": "mo teng", "ven": "kha", "tso": "eka"}
{"eng": "is", "zul": "uyena", "xho": "yilo", "sot": "ke", "nso": "ke", "tsn": "ke", "ven": "ndi", "tso": "i"}
{"eng": "it", "zul": "yona", "xho": "lona", "sot": "ona", "nso": "ona", "tsn": "ona", "ven": "e", "tso": "kona"}
{"eng": "its", "zul": "yakhe", "xho": "yakhe", "sot": "ya eona", "nso": "ya yona", "tsn": "ya yone", "ven": "yawe", "tso": "yakwe"}
{"eng": "just", "zul": "nje", "xho": "nje", "sot": "feela", "nso": "feela", "tsn": "fela", "ven": "fhedzi", "tso": "kambe"}
{"eng": "like", "zul": "njenge", "xho": "njenge", "sot": "joalo ka", "nso": "bjalo ka", "tsn": "jaaka", "ven": "sa", "tso": "tanihi"}
{"eng": "me", "zul": "mina", "xho": "mna", "sot": "na", "nso": "na", "tsn": "nna", "ven": "nṋe", "tso": "mina"}
{"eng": "more", "zul": "ngaphezulu", "xho": "ngaphezulu", "sot": "holo", "nso": "go feta", "tsn": "go feta", "ven": "zwoṱhe", "tso": "hinkwaswo"}
{"eng": "most", "zul": "okukhulu", "xho": "uninzi", "sot": "holo", "nso": "ka moso", "tsn": "go feta", "ven": "zwoṱhe", "tso": "hinkwaswo"}
{"eng": "my", "zul": "wami", "xho": "wam", "sot": "ka", "nso": "ka", "tsn": "ka", "ven": "anga", "tso": "waka"}
{"eng": "no", "zul": "cha", "xho": "hayi", "sot": "che", "nso": "aowa", "tsn": "aowa", "ven": "aowa", "tso": "e-e"}
{"eng": "not", "zul": "hayi", "xho": "hayi", "sot": "ha ho joalo", "nso": "ga go bjalo", "tsn": "ga go jalo", "ven": "a si", "tso": "a ku ri"}
{"eng": "now", "zul": "manje", "xho": "ngoku", "sot": "hona joale", "nso": "bjale", "tsn": "jwale", "ven": "zwino", "tso": "sweswi"}
{"eng": "of", "zul": "ka", "xho": "ka", "sot": "ya", "nso": "ya", "tsn": "ya", "ven": "kha", "tso": "ka"}
{"eng": "on", "zul": "phezu", "xho": "phezu", "sot": "ka", "nso": "ka", "tsn": "mo", "ven": "kha", "tso": "ka"}
{"eng": "one", "zul": "oyedwa", "xho": "nye", "sot": "ngoe", "nso": "ngwe", "tsn": "ngwe", "ven": "nthihi", "tso": "yin'we"}
{"eng": "only", "zul": "kuphela", "xho": "kuphela", "sot": "feela", "nso": "feela", "tsn": "fela", "ven": "fhio", "tso": "kuva"}
{"eng": "or", "zul": "noma", "xho": "okanye", "sot": "kapa", "nso": "kapa", "tsn": "kapa", "ven": "kana", "tso": "kumbe"}
{"eng": "other", "zul": "unye", "xho": "enye", "sot": "e nngwe", "nso": "ye nngwe", "tsn": "tse dingwe", "ven": "eṅwe", "tso": "yin'wana"}
{"eng": "our", "zul": "wethu", "xho": "wethu", "sot": "ya rona", "nso": "ya rena", "tsn": "ya rona", "ven": "ashu", "tso": "wa hina"}
{"eng": "out", "zul": "phandle", "xho": "phandle", "sot": "ka ntle", "nso": "ka ntle", "tsn": "kwa ntle", "ven": "nga fhasi", "tso": "handle"}
{"eng": "said", "zul": "wathi", "xho": "thetha", "sot": "re", "nso": "re", "tsn": "re", "ven": "nga amba", "tso": "vulavula"}
{"eng": "same", "zul": "efanayo", "xho": "efanayo", "sot": "tse tšoanang", "nso": "tse swanago", "tsn": "tse tshwanang", "ven": "vhoṱhe", "tso": "fanani"}
{"eng": "she", "zul": "yena", "xho": "yena", "sot": "yena", "nso": "yena", "tsn": "yena", "ven": "e", "tso": "yena"}
{"eng": "should", "zul": "kufanele", "xho": "kufuneka", "sot": "e lokela", "nso": "go swanela", "tsn": "go tshwanela", "ven": "nga vha", "tso": "fanele"}
{"eng": "so", "zul": "kanjalo", "xho": "kanjalo", "sot": "kahoo", "nso": "ka fao", "tsn": "ka jalo", "ven": "zwivhuya", "tso": "tana"}
{"eng": "some", "zul": "abanye", "xho": "abanye", "sot": "tse ling", "nso": "tse dingwe", "tsn": "tse dingwe", "ven": "vhaṅwe", "tso": "van'wana"}
{"eng": "than", "zul": "kunokuba", "xho": "ukuba", "sot": "ho", "nso": "go", "tsn": "go", "ven": "u", "tso": "ku"}
{"eng": "that", "zul": "ukuthi", "xho": "ukuba", "sot": "hore", "nso": "gore", "tsn": "gore", "ven": "uri", "tso": "leswaku"}
{"eng": "the", "zul": "i", "xho": "i", "sot": "the", "nso": "the", "tsn": "the", "ven": "zwi", "tso": "leswi"}
{"eng": "their", "zul": "yabo", "xho": "yabo", "sot": "ya bona", "nso": "ya bona", "tsn": "ya bone", "ven": "ya vhona", "tso": "ya vona"}
{"eng": "them", "zul": "bona", "xho": "bona", "sot": "bona", "nso": "bona", "tsn": "bona", "ven": "vho", "tso": "vona"}
{"eng": "then", "zul": "ke", "xho": "ke", "sot": "ke", "nso": "ke", "tsn": "ke", "ven": "huna", "tso": "kale"}
{"eng": "there", "zul": "lapho", "xho": "apho", "sot": "moo", "nso": "moo", "tsn": "kwa", "ven": "hu", "tso": "kwalaho"}
{"eng": "these", "zul": "lezi", "xho": "ezi", "sot": "tse tsena", "nso": "tse tsena", "tsn": "tse tsena", "ven": "eḽa", "tso": "leswi"}
{"eng": "they", "zul": "bona", "xho": "bona", "sot": "bona", "nso": "bona", "tsn": "bona", "ven": "vho", "tso": "vona"}
{"eng": "this", "zul": "le", "xho": "le", "sot": "e", "nso": "se", "tsn": "se", "ven": "iḽi", "tso": "leswi"}
{"eng": "to", "zul": "ku", "xho": "ukuya", "sot": "ho", "nso": "go", "tsn": "go", "ven": "kha", "tso": "ka"}
{"eng": "up", "zul": "phezulu", "xho": "phezulu", "sot": "holimo", "nso": "godimo", "tsn": "godimo", "ven": "fhasi", "tso": "ehenhla"}
{"eng": "very", "zul": "kakhulu", "xho": "kakhulu", "sot": "holo", "nso": "holo", "tsn": "golo", "ven": "hoṱhe", "tso": "hinkwaswo"}
{"eng": "was", "zul": "baye", "xho": "waye", "sot": "e bile", "nso": "e bile", "tsn": "e bile", "ven": "nga vha", "tso": "a ri na"}
{"eng": "we", "zul": "thina", "xho": "thina", "sot": "rona", "nso": "rena", "tsn": "rona", "ven": "ashu", "tso": "hina"}
{"eng": "were", "zul": "baye", "xho": "waye", "sot": "bileng", "nso": "bileng", "tsn": "bileng", "ven": "nga vha", "tso": "a ri na"}
{"eng": "what", "zul": "ini", "xho": "ini", "sot": "eng", "nso": "eng", "tsn": "eng", "ven": "ni", "tso": "leswi"}
{"eng": "when", "zul": "nini", "xho": "nini", "sot": "neng", "nso": "neng", "tsn": "neng", "ven": "ri", "tso": "swi"}
{"eng": "which", "zul": "yiphi", "xho": "yiphi", "sot": "feela", "nso": "feela", "tsn": "fela", "ven": "ne", "tso": "xin'wana"}
{"eng": "who", "zul": "ubani", "xho": "ubani", "sot": "mang", "nso": "mang", "tsn": "mang", "ven": "nnyi", "tso": "mani"}
{"eng": "will", "zul": "uzoba", "xho": "za kuba", "sot": "tla ba", "nso": "tla ba", "tsn": "tla ba", "ven": "nga vha", "tso": "ta ku va"}
{"eng": "with", "zul": "na", "xho": "ne", "sot": "le", "nso": "le", "tsn": "le", "ven": "na", "tso": "na"}
{"eng": "would", "zul": "uzoba", "xho": "za kuba", "sot": "ka ba", "nso": "ka ba", "tsn": "ka ba", "ven": "nga vha", "tso": "ta ku va"}
{"eng": "you", "zul": "wena", "xho": "wena", "sot": "wena", "nso": "wena", "tsn": "wena", "ven": "iwe", "tso": "wena"}
{"eng": "your", "zul": "yakho", "xho": "yakho", "sot": "ya hao", "nso": "ya gago", "tsn": "ya gago", "ven": "yawe", "tso": "yakwe"}