2005-11-29

[Phonetics]中國古代的四聲

k75k7四聲的觀念大概始於南北朝。

《梁書》記載,沈約寫過《四聲譜》
梁武帝蕭衍問臣子周舍何謂是四聲,周舍答:「天子聖哲」 (剛好是平上去入,又能拍皇帝馬屁)
後來隋朝陸法言(A.D. 601)撰《切韻》,使用了「平、上、去、入」的名稱,遂流傳至今。

此外,其他人對於四聲的描述如下:
唐‧釋處忠元和韻譜明‧釋真空玉鑰匙歌訣
平聲哀而安平聲平道莫低昂
上聲厲而舉上聲高呼猛烈強
去聲清而遠去聲分明哀遠道
入聲直而促入聲短促急收藏

清‧顧炎武
江永
張成孫
王鳴盛
澤田總清源
輕遲長空如擊鐘鼓長言舌頭言之無抑揚
重疾短實如擊土木石短言舌腹言之抑揚
重疾短實如擊土木石重言急氣言之抑抑
重疾短實如擊土木石急言閉氣言之揚抑

============================
參考資料:
Wikipedia :四聲

2005-11-28

[CALL] Celebrating Language

e-Learning Awards 2005 從30多個國家、800個e-Learning計畫中
選出了 Top 100 的數位學習計畫
其中有一個網站是 Celebrating Language
利用Flash視訊和文字等
教14種不同的語言:中文、廣東話、泰文、德文、波蘭文、俄羅斯、西班牙...等等

以CALL而言,並不覺得它做得很精緻
(甚至中文的課程裡面有些錯誤)
但我覺得重要的是它背後隱含的精神:
英文不是世界上唯一的語言!

尊重不同的文化、不同的語言向為西方文化所提倡
該計畫能夠將此付諸於行動
是應該獲得更多的掌聲的!

2005-11-24

[Phonetics] .NSP 轉 .WAV 的 Praat Scrpt

一小段 Praat Script
可以將CSL的專屬格式.nsp轉成.wav
預設路徑是C:\temp
########################################
# Name: Convert .NSP to .WAV
# By: Pbice
# Date: 2005/11/23
########################################

directory$ = "C:\temp\"

Create Strings as file list... list 'directory$'/*.nsp
numberOfFiles = Get number of strings

for ifile to numberOfFiles
select Strings list
fileName$ = Get string... ifile
Read from file... 'directory$'/'fileName$'
fileName$ = fileName$ - ".nsp"
Write to WAV file... 'directory$'/'fileName$'.wav
Remove
endfor

select Strings list
Remove

2005-11-22

[CALL] Networked multimedia environments for second language acquisition

Design considerations for networked multimedia language learning environments
============================================
General capabilities of the WWW that have the potential to enhance language learning:
  1. the universal availability of authentic materials
  2. the communication capabilities through networking
  3. the multimedia capabilities
  4. nonlinear structure of the information
============================================
Chun, D. M., & Plass, J. L. (2000). Networked multimedia environments for second language acquisition. In M. Warschauer & R. Kern (Eds.), Network-Based Language Teaching (pp. 151-170). Cambridge: Cambridge University.

[Phonetics] 兒化

挺有趣的圖片,頗能生動描繪兒化特色
^_^

ps. 忘了從哪個網站偷來的了,如有侵權請告知

2005-11-20

[CALL]CALL Journals

電腦輔助語言教學(Computer Assisted Language Learning, CALL)的相關期刊,依字母及筆畫排序。

1. 英文:
2. 繁體中文
3. 簡體中文
  • 中小學電教
  • 中國電化教育
  • 外語電化教學
  • 教育技術研究
  • 現代教育技術
  • 現代遠距離教育
  • 開放教育研究
  • 資訊技術教育
  • 電化教育研究

2005-11-18

[Phonetics] 漢字轉拼音--雖小道亦可觀

將漢字轉拼音的技術
其實很多軟體都能夠做得到
並不是什麼太難的東西
例如 MS Word 裡面,就可以在[格式][亞洲配置方式][注音標示]
就可在文字的旁邊加上注音

=====================================
<方法一> 中文字碼

如果要在網頁上轉換
可以透過ASP或PHP來實現
網際智慧也在線上展示漢字轉成拼音的技術
ASP漢音轉拼音的原理
大概是將將所欲查詢的漢字,透過中文字的編碼來對應
不過這樣轉換是沒有調號的
顯然不符合我們的需求

=====================================
<方法二> 漢字讀音資料庫

還有別的方法可以將漢字轉換成漢語拼音
例如:海嘯工作室的軟件
又或者是鄭錦全老師開發的CCLang
以及鄧老師的Pintone

這些軟體的原理大概是:
先有一個資料庫記錄了所有漢字的拼音,然後將所要查詢的字送到裡面去比對
如果有多音字,則同時傳回好幾個值。

不過,這些軟體都有一個缺點 就是無法處理多音字
例如在CCLang裡轉換「不要」,會得到下面的結果:
bu2?bu4yao1?yao4
因為是單字的對應,因此基本上無法解決多音字的問題

=====================================
<方法三> 詞庫+統計

既然單一的字--音對應無法解決問題
那麼利用已經注音的詞庫呢?

因此,可以為每一個多音字先確定一個常用的字音
然後盡可能將包含多音字的非常用音的詞羅列在一個詞典中
在字-音轉換時,如果查到匹配的詞就根據詞典確定讀音
如果沒有查到,就採取缺省讀音
這樣的作法還是會有問題
因為無法解決詞典中的多音字,也就是OOV(Out Of Vocabulary)

中文常「因聲以別義」
也就是利用語音的不同來區辨不一樣的意思
因此也有人想到利用語義來處理多音字的消歧
如Lu(2002)利用知網 (HowNet) 來處理多音字
正確率約可達九成。

張子榮 & 初敏 (2002) 則建議,多音字/詞的重要性是不相等的
他們建議重點處理41個多音字和22個多音詞
因為這些多音字/詞,其累積頻率約95% ,亦即涵蓋了大部分的語料
而在多音字當中,通常會有最常用的「強勢音」
如果能針對這些來生成規則
則可以解決大部分多音字/詞的問題
其正確率約可提高一成,達到93%左右。

============================================
後記:
漢字轉注音,只是文--語轉換技術的其中一小部分
只是有感於自己能掌握的漢字轉注音的技術相當原始
方撰此文

真的要100%解決這個問題,還是相當不容易的

其道雖小,然誠有可觀者!

============================================
附錄:
目前市面上的拼音標注軟體 :
台灣:

Note: (華康和文鼎不是從漢字轉拼音,只是標注)

大陸:

==========================================
引用文獻:

2005-11-14

[Miscellaneous] Three ways to draw syntax tree

1. phpSyntaxTree

Note:必須把樹寫成橫式
[S [NP ta1][VP [S [NP [S [NP ta1] [VP you3 tou2]] [N tou2] ] [VP teng2] ] ] ]



2. Trees Player




3. Microsoft VISIO




其他的畫樹軟體:Linguist List

2005-11-10

[Computer] 啟動Word時不載入Dr.Eye工具列

1. 關閉 Office
2. 開啟機碼編輯器
3. 找到下面的機碼
HKEY_CURRENT_USER\Software\Microsoft\Office  Word\Addins\DreyeWdAddin.WordAddin.1
4. 雙擊右邊窗格裡的 LoadBehavior
5. 將 LoadBehavior 改成 0
6. 重新開啟 Word

From: Microsoft MVP 卓立民