Skip to content

Taiwanese-Corpus/Linya-Huang_2014_taiwanesecharacters

Repository files navigation

咱的字你敢捌-台語漢字

緣起

為推廣台語漢字,特設立此平台,依教育部閩南語常用辭典為標準校正台語歌詞用字。 為著欲推廣台語漢字,特別設立這个平台,依教育部閩南語常用辭典為標準校正台語歌詞用字。 (純為學術研究,絕無商業用途)

附件有簡介之PPT歡迎點閱: )

資料處理

原始資料

本專案原始資料是用google-sites-liberation掠的。

臺灣言語資料庫

sudo apt-get install -y python-virtualenv python3 python3-dev libyaml-dev
virtualenv --python=python3 venv
. venv/bin/activate
pip install pyyaml beautifulsoup4 lxml
python 產生臺灣言語資料庫格式.py

匯入資料

臺灣言語資料庫專案目錄下

python manage.py 匯入資料 https://Taiwanese-Corpus.github.io/linya-huang_taiwanesecharacters/咱的字你敢捌.yaml

Releases

No releases published

Packages

No packages published