- 臺灣客話詞彙資料庫
- xls、HTML和mp3
- 102年版教材
- xls
- html跟mp3:http://wiki.hakka.gov.tw/search-detail.aspx?param=N, 72338<=N<=118502
- 哈客網路學院教材
- 哈客網路學院線上學習
sudo apt-get install -y python3 python-virtualenv g++ libxml2-dev libxslt-dev python-dev
virtualenv --python=python3 venv
. venv/bin/activate
pip install -r requirements.txt
python 下載資料/臺灣客語詞彙資料庫.py
合併/原始.csv
是合併臺灣客話詞彙資料庫全部的xls合併/網站詞目.csv
是臺灣客話詞彙資料庫網頁上的資料
兩個檔除了少部份(14條)詞目不同外,合併/網站詞目.csv
多包含外來語。
針對合併/網站詞目.csv
處理造字,並轉出網站詞目補造字.csv
。
在使用臺灣言語資料庫
的專案目錄下
sudo apt-get install -y python3 python-virtualenv
virtualenv --python=python3 venv
. venv/bin/activate
pip install -r requirements.txt
python 轉到臺灣言語資料庫/整合到資料庫.py
會產生臺灣客話詞彙資料庫語料.yaml
語料檔
python manage.py 匯入資料 https://Taiwanese-Corpus.github.io/hakka_elearning/臺灣客話詞彙資料庫語料.yaml
在hakka_elearning
專案目錄下
sudo apt-get install -y python-virtualenv g++ libxml2-dev libxslt-dev python-dev
virtualenv --python=python3 venv
. venv/bin/activate
python -m unittest